clip2 CLIP score, CLIP aesthetics score 란? 목차1.CLIP score란?2.CLIP score 코드3.CLIP aesthetics score란?4.CLIP aesthetics score 코드 CLIP score란?CLIP score란 주로 text-to-image task에 사용되는 지표로써, 입력 text와 생성된 image 간의 embedding cosine similarity를 측정한 값입니다. CLIP은 CLIP text encoder와 CLIP image encoder가 있습니다. text encoder에 입력 text를 넣어서 text embedding value를 얻고, image encoder에 생성된 이미지를 넣어서 image embedding value를 얻습니다. 이후 두 embedding values에 대한 cosine si.. 2024. 9. 4. ControlNet 논문 자세한 정리 ControlNetControlNet로 유명한 논문 Adding Conditional Control to Text-to-Image Diffusion Models에 대한 정리입니다. ControlNet에 대한 짧은 정리는 다음 게시물을 참고해 주세요.5분 안에 이해하는 ControlNet 간단 정리 자료 5분 안에 이해하는 ControlNet 간단 정리 자료ControlNet 무엇을 할 수 있을까?기존의 StableDiffusion은 유저가 입력한 text로부터 이미지를 생성합니다. Bird라는 text에 맞게 새 (bird) 이미지를 생성할 수 있지만, 내가 원하는 포즈를 하고 있는 새 (bgrow-up-by-coding.tistory.com ControlNet 논문 arxiv 주소: https://a.. 2024. 9. 4. 이전 1 다음