2️⃣Text to Image

Text to Image

텍스트-이미지 변환 작업은 텍스트 설명에서 시각적 표현(이미지)을 생성하는 작업입니다. 이 과정은 이미지를 설명하는 텍스트 입력으로 시작됩니다. 간단한 설명부터 복잡하고 추상적인 개념까지 다양한 내용이 포함될 수 있습니다. 모델은 텍스트를 처리하여 내용을 이해한 다음 설명과 일치하는 이미지를 생성합니다. 여기에는 텍스트의 의미를 이해하고, 설명된 요소를 시각화하여 일관된 이미지로 조립하는 작업이 포함됩니다.

Stable Diffusion

circle-info

Diffusion 관련 Diffuser 라이브러리는 Huggingface Basic의 Diffuser 세션 참조

https://www.loudai.net/huggingface/huggingface-basic/diffusersarrow-up-right

%pip install diffusers
from diffusers import DiffusionPipeline
import torch

pipe = DiffusionPipeline.from_pretrained(
    "stabilityai/stable-diffusion-xl-base-1.0", 
    torch_dtype=torch.float32, 
    use_safetensors=True
)
pipe.to("cuda")
prompt = "super dog riding a red horse"

image = pipe(prompt=prompt).images[0]
image

Diffusion UNet

Last updated