본문 바로가기

딥러닝 기초6

Variational Autoencoder (VAE)와 ELBO, KL Divergence 이해하기 Variational Autoencoder(VAE)는 생성 모델 중 하나로, 데이터의 잠재 표현(latent representation)을 학습하면서 데이터를 재구성하는 모델입니다. VAE를 학습하기 위해 중요한 개념인 Evidence Lower Bound (ELBO)와 KL Divergence에 대해 자세히 알아보겠습니다. 목록1. VAE의 기본 개념2. Evidence Lower Bound (ELBO)3. KL Divergence의 형태 유도4. MNIST 데이터를 활용한 VAE 구현 예제 (PyTorch)5. 결론  1. VAE의 기본 개념VAE는 두 가지 네트워크로 구성됩니다.인코더(Encoder): 입력 데이터 $x$로부터 잠재 변수 $z$의 근사 분포 $q(z|x)$ (보통 정규 분포의 평균 .. 2025. 2. 13.
CLIP score, CLIP aesthetics score 란? 목차1.CLIP score란?2.CLIP score 코드3.CLIP aesthetics score란?4.CLIP aesthetics score 코드 CLIP score란?CLIP score란 주로 text-to-image task에 사용되는 지표로써, 입력 text와 생성된 image 간의 embedding cosine similarity를 측정한 값입니다. CLIP은 CLIP text encoder와 CLIP image encoder가 있습니다. text encoder에 입력 text를 넣어서 text embedding value를 얻고, image encoder에 생성된 이미지를 넣어서 image embedding value를 얻습니다. 이후 두 embedding values에 대한 cosine si.. 2024. 9. 4.
5분 안에 이해하는 ControlNet 간단 정리 자료 자세한 정리는 다음 링크를 참고해 주세요.ControlNet 논문 자세한 정리 ControlNet 논문 자세한 정리ControlNetControlNet로 유명한 논문 Adding Conditional Control to Text-to-Image Diffusion Models에 대한 정리입니다. ControlNet에 대한 짧은 정리는 다음 게시물을 참고해 주세요.5분 안에 이해하는 ControlNet 간단 정grow-up-by-coding.tistory.com  ControlNet 무엇을 할 수 있을까?기존의 StableDiffusion은 유저가 입력한 text로부터 이미지를 생성합니다. Bird라는 text에 맞게 새 (bird) 이미지를 생성할 수 있지만, 내가 원하는  포즈를 하고 있는 새 (bird.. 2024. 8. 30.
인공신경망을 이용한 MNIST 손글씨 분류하기 인공신경망이란? 인공신경망이란 인간의 뉴런을 모방하여 기계를 학습시는 방법입니다. 인공신경망을 구현하기 위해 퍼셉트론이라는 개념을 알고 계셔야 합니다. 다층 퍼셉트론 개발 환경 python3.7 tensorflow 1.14.0 환경설정 방법: https://grow-up-by-coding.tistory.com/15 아나콘다 가상환경 생성 및 주피터 노트북에 추가하기 개발환경 Windows10, anaconda3(64bit)+python3.8 가상환경: python3.7 tensorflow 1.14.0 가상환경 생성 cmd창을 켜주세요! 그리고 다음과 같은 명령어를 입력해주세요! conda create -n tfbook 또는 conda creat.. grow-up-by-coding.tistory.com 예.. 2020. 7. 31.
Softmax 회귀로 MNIST 손글씨 분류하기 개발 환경 설정 python3.7 tensorflow 1.14.0 https://grow-up-by-coding.tistory.com/15 아나콘다 가상환경 생성 및 주피터 노트북에 추가하기 개발환경 Windows10, anaconda3(64bit)+python3.8 가상환경: python3.7 tensorflow 1.14.0 가상환경 생성 cmd창을 켜주세요! 그리고 다음과 같은 명령어를 입력해주세요! conda create -n tfbook 또는 conda creat.. grow-up-by-coding.tistory.com 예제 1 2 import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data cs 위와 같이 필.. 2020. 7. 29.
머신러닝(기계학습)과 딥러닝의 차이점 차이점 머신러닝과 딥러닝의 차이점을 이미지 분류를 예를 들어 설명하겠습니다. 기계가 고양이 이미지를 학습하기 위해서 고양이의 특징을 파악할 필요가 있습니다. 고양이의 귀, 얼굴, 몸, 꼬리 등 고양이라고 판단할 수 있는 특징을 알아내야 합니다. 사람이 특징을 추출하여 기계를 학습한다면 이는 머신러닝이며 기계가 특징을 추출하여 학습을 한다면 이는 딥러닝입니다. 머신러닝에는 지도학습, 비지도학습, 강화학습, 딥러닝 등 다양한 종류의 기계학습들이 있습니다. 즉, 딥러닝은 머신러닝의 한 종류라고 보시면 됩니다. 인공지능이란? 더 포괄적인 영역으로 AI, 인공지능이 있습니다. 사람의 행동을 기계가 모방하는 것을 인공지능이라고 합니다. 즉, 인공지능 영역 안에 머신러닝이 있고 머신러닝 영역 안에 딥러닝이 있습니다. 2020. 7. 29.