안녕하세요
오늘은 스테이블 디퓨전의 기본적인 개념들에 대해서 소개해보도록 하겠습니다.
스테이블 디퓨전에 대해서 잘 모르신다면 이전 글을 참고해주세요!
스테이블 디퓨전은 다른 이미지 생성 툴에 비해서 난이도가 조금 있는 편입니다.
하지만 그만큼 자유도도 높은 툴이라고 할 수 있습니다.
그래서 그 기본 개념을 천천히 학습하면서 잘 숙지하고 활용한다면 본인이 원하는 뛰어난 이미지 생성을 할 수 있게 됩니다.
스테이블 디퓨전의 기본 개념과 용어
스테이블디퓨전 준비 사항
먼저 스테이블디퓨전으로 이미지를 생성하기 위해서는 stable diffusion webui가 먼저 설치가 되어 있어야 합니다.
설치 방법에 대해서 지난 번에 올린 포스팅 글을 참고하시면 됩니다.
기본적으로 사양이 꽤 필요합니다.
그래픽 카드 : RTX 3060 이상 (vram이 더 클수록 좋습니다.)
Ram : 최소 8GB 이상 ( 저는 개인적으로 최소 16GB는 되어야 한다고 봅니다. 클수록 좋습니다.)
SSD: 1TB 이상 (체크포인트와 같은 파일들이 생각보다 용량을 많이 차지합니다.)
스테이블 디퓨전의 기본 개념
오늘은 기본개념들에 대해서 간략하게 소개하도록 하겠습니다.
스테이블디퓨전을 통해서 이미지를 생성해야할 때 알아야할 기본적인 개념은 크게 3가지 있다고 생각하시면 간단합니다.
- 이미지 생성기능 : CheckPoint, Lora, Embedding, VAE, 등등
- 디테일 조정 기능 : Sampling, Hires,Fix, CFG Scale, 등등
- 확장 기능 : Controlnet, Adetailer, Dyanmic-Prompts, 등등
오늘은 이미지 생성 기능에 대해서만 알아보도록 하겠습니다!
1.PromPt (프롬프트)
프롬프트는 이미지 생성의 가장 기본이 되는 입력입니다.
생성하고자 하는 이미지의 내용을 입력하게 되면 원하는 이미지를 생성하게 됩니다.
프롬프트에는 Postive Prompt와 Negative Prompt가 존재합니다.
아래이미지를 보시면 윗쪽이 Positive 아래쪽이 Negative 프롬프트 입력 칸입니다.
이미지에서 표현하고 싶은 내용은 postive에 입력을 하고 제외하고 싶은 요소는 negative 에 입력을 하게 되면, 불필요한 요소를 배제하고 이미지를 생성할 수 있습니다.
하지만 프롬프트에 입력을 하더라도 원하는 방향대로 이미지를 생성을 못하는 경우가 굉장히 많을 것입니다.
AI는 학습을 하는 툴이기 때문에 계속 시도하고, 반복 생성하시는 것은 필수입니다.
2. CheckPoint (체크포인트)
체크포인트는 생성되는 이미지의 스타일을 결정짓는 가장 중요한 부분이라고 할 수 있습니다.
다양한 체크포인트의 모델이 있으며, 다량의 이미지 학습을 시켜서 만든 모델이기 때문에 대부분 2GB 이상의 용량을 가지고 있습니다. AI모델의 학습된 상태를 저장한 파일이기 때문에 다양한 스타일의 이미지를 생성할 수 있게 만들어줍니다.
그래서 쉽게 말하자면 체크포인트는 "화가"라고 생각하시면 됩니다. 화가마다 각자의 스타일이 다 존재하듯이, 체크포인트마다 스타일이 다릅니다. 아래 이미지를 보시면 각각의 체크포인트별로 그 스타일의 차이가 있다는 것을 알 수 있습니다.
체크포인트는 CIVITAi 라는 사이트에서 많이 등록되어 있습니다. 여기서 원하시는 스타일을 찾아보시고 생성해보시면 연습해보면 도움이 많이 되실 것입니다.
3. LoRA (로라)
Low-Rank Adaptation 의 줄임말 로라는 체크포인트에서 정한 스타일에 더욱 세세하고 디테일한 부분을 결정짓는 보조의 역할을 한다고 생각하시면 됩니다.
디테일한 부분이라고 했지만 전체적인 그림의 스타일이 완전히 바뀔수도 있습니다. 체크포인트에서 생성된 기본 이미지에 새로운 스타일을 덧 붙여지는 역할도 함께 하고 있습니다.
보조 모델이기 때문에 체크포인트보다 훨씬 가벼운 용량을 가지고 있습니다.
아래 이미지를 보시면 같은 프롬프트로 왼쪽은 로라를 적용 안했을 때, 오른쪽은 로라를 적용한 이미지입니다. 같은 프롬프트이지만 확실히 스타일적으로 차이가 나는 것이 보이시나요?
로라는 단순히 스타일 측면 뿐만 아니라, 손의 디테일, 눈의 디테일, 배경의 디테일 등 더욱 디테일하고 퀄리티 높은 이미지를 생성할 수 있도록 돕습니다.
4. VAE (Variational Auto Encoder)
vae는 생성된 이미지의 화질이나 색감을 보정해주는 역할이라고 생각하시면 됩니다.
보통 체크포인트나 로라처럼 자주 바꾸면서 쓰지 않고, 보통 버전별로 하나씩 쓰게 됩니다.
버전별로 다른 vae를 사용하게 되면 이미지가 깨져서 나오게 되니 이 점을 주의해야 합니다.
요즘에는 좋은 체크포인트에는 VAE가 포함되어 있어서, 큰 의미가 없다고 이야기도 있습니다.
오늘은 정말로 몇개 개념에 대해서만 간단히 소개를 드렸습니다.
앞으로 스테이블 디퓨전으로 실제 이미지를 잘 만들기 위해서 어떻게 하면 좋을지 꾸준히 글을 써나가도록 하겠습니다!
여기까지 읽어주셔서 감사합니다.
함께 읽으면 좋은 콘텐츠
뉴럴닌자ai - AI로 그림 만들기!
'알쓸신잡(AI 정보,각종 정보) > 스마트한 AI 정보' 카테고리의 다른 글
미드저니 퀄리티 급상승! 간단한 파라미터 설정 팁 (1) | 2024.09.26 |
---|---|
미드저니 플랜 별 차이 완벽정리 : 초보자에게 추천하는 플랜은?! (0) | 2024.09.11 |
Stable Diffusion(스테이블 디퓨전) WebUI 설치방법 : 윈도우 OS (1) | 2024.09.09 |
스테이블 디퓨전 초간단 설치방법 : 맥OS에서 설치하기 (1) | 2024.09.08 |
Stable Diffusion(스테이블 디퓨젼)이란? 내 비즈니스에 활용방법은? (8) | 2024.09.04 |