본문 바로가기

전체 글73

AdaIN Style Transfer 정리 및 코드 StyleTransfer 방법 중 하나인 AdaIN에 대해 정리하고 코드를 공유해 보도록 하겠습니다.IntroductionLossCodeResultsIntroductionStyleTransfer는 source image의 content는 유지하면서 target image의 style로 변경하는 기법을 의미합니다.AdaIN 논문 바로가기: https://arxiv.org/pdf/1703.06868 기존의 StyleTransfer (14초)에 비해 매우 빠른 속도로 스타일 변환이 가능합니다. 약 0.018초 VGG를 사용하는 것은 유사하나 다음과 같은 식을 이용해서 이미지 특징의 평균과 분산을 바꿈으로써 스타일 변환을 시도합니다.$$ \text{AdaIN}(x,y) = \sigma(y) \Big( \frac.. 2025. 3. 23.
Variational Autoencoder (VAE)와 ELBO, KL Divergence 이해하기 Variational Autoencoder(VAE)는 생성 모델 중 하나로, 데이터의 잠재 표현(latent representation)을 학습하면서 데이터를 재구성하는 모델입니다. VAE를 학습하기 위해 중요한 개념인 Evidence Lower Bound (ELBO)와 KL Divergence에 대해 자세히 알아보겠습니다. 목록1. VAE의 기본 개념2. Evidence Lower Bound (ELBO)3. KL Divergence의 형태 유도4. MNIST 데이터를 활용한 VAE 구현 예제 (PyTorch)5. 결론  1. VAE의 기본 개념VAE는 두 가지 네트워크로 구성됩니다.인코더(Encoder): 입력 데이터 $x$로부터 잠재 변수 $z$의 근사 분포 $q(z|x)$ (보통 정규 분포의 평균 .. 2025. 2. 13.
[논문 리뷰] StructuredField: Unifying Structured Geometry and Radiance Field 정리 StructuredField: Unifying Structured Geometry and Radiance Field라는 논문을 정리하겠습니다.[논문 바로가기] 목차배경방법실험배경기존의 3D Gaussian splatting(3DGS)과 같은 point-based 접근법은 구조적(structured)이지 않습니다. 그래서 편집과 시뮬레이션에는 적절하지 않습니다. 이를 해결하기 위해, StructuredField라는 것을 제안했고, 이것은 기존의 3DGS와 달리 구조적이며 3DGS의 특징인 고해상도의 빠른 렌더링도 할 수 있습니다.방법StructureField는 3DGS를 표현하기 위해 Tetrahedral mesh(사면체 메시)를 이용합니다. 전반적인 방법입니다. 주어진 여러 장의 multi-view 이미.. 2025. 2. 2.
[논문 리뷰] BLIP2, Q-Former 요약 정리 Q-Former는 Querying Transformer의 약자로 BLIP-2 (BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models) 논문에서 처음 소개되었습니다.논문 바로가기: https://arxiv.org/abs/2301.12597목차Q-Former 제안 배경Q-Former 동작 과정Vision-and-Language Representation LearningVision-to-Language Generative Learning결과Q-Former 제안 배경기존의 LLM은 텍스트 입력만을 받기 때문에 이미지를 입력할 수 없습니다. 이미지를 LLM에 입력하여 이미지에 대해서 .. 2025. 1. 28.
SMPL texture 입히기 다음과 같이 SMPL 메시에 texture를 입히는 방법입니다. 필요한 라이브러리렌더링을 위한 pytorch3d.Pose 변경을 위한 smplx 라이브러리와 SMPL 모델 pickle 파일.등이 필요합니다. Texture png maptexture png 파일을 다운받아야 합니다. 다음의 주소에서 2개의 png 파일을 받을 수 있습니다.https://app.box.com/s/mdx2m368j9m0jgkkjnf67l6blrwrt20f코드관련 코드는 다음 깃허브 주소에서 확인할 수 있습니다.https://github.com/JunukCha/textured_smpl/tree/main?tab=readme-ov-file GitHub - JunukCha/textured_smplContribute to JunukCh.. 2025. 1. 17.
CUDA/CuDNN 설치하기 CUDACUDA 12.1을 설치하기 위해 아래의 홈페이지에 들어가서 절차대로 진행해줍니다.https://developer.nvidia.com/cuda-12-1-0-download-archive?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=22.04&target_type=deb_local본인의 OS 환경에 맞게 선택해주세요! 위의 명령어대로 설치해주면 됩니다. CuDNNhttps://developer.nvidia.com/rdp/cudnn-archive위의 링크를 타고 들어가서 본인 CUDA 버전에 맞는 최신 버전의 cudnn을 설치해주세요.(Tar)라고 적힌 것을 OS에 맞게 다운로드합니다. tar -xvf cudnn-linu.. 2025. 1. 12.