챗GPT와 달리3(DALL·E)의 연결을 통해 사용자들은 다양한 이미지 생성 경험을 할 수 있게 되었다. 기존에 미드저니와 스테이블 디퓨전 방식을 통해 프롬프트의 사용법을 경험한 사용자들은 프롬프트에 대한 깊은 이해를 가지고 있을 것이라 예상된다.
챗GPT를 통해 달리3(DALL·E)에 텍스트 기반의 프롬프트를 직접 전송할 수 있어 매우 편리하다. 이 편리성 때문에 기대감을 가지고 이미지 작업에 도전했으나, 몇 일 동안 경험해본 결과, 원하는 이미지를 정확하게 생성하는 것은 여전히 어려운 부분이 있었다.
달리3(DALL·E) 이미지 생성에 대한 가이드라인을 찾아 학습하며 이해도가 점차 높아졌다. 이해한 내용을 다른 이들과 공유하고자 글을 작성했다.
앞으로 챗GPT와 달리3(DALL·E)를 활용한 이미지 생성 경험을 지속적으로 블로그에 소개할 예정이다
- [book]월 20달러로 비즈니스 글쓰기 with 챗GPT
- 온라인강좌: ③달리(DALL-E): 초보자를 위한 이미지 생성 가이드(입문편)
- 온라인강좌: ④달리(DALL-E): 이미지 생성 가이드 – 블로그편
- 챗GPT와 달리3: ⓪이미지 프롬프트 가이드라인 A-Z
- 전자책: ⑦DALL-E 이미지 프롬프트 가이드
- 전자책: ⑥챗GPT 프롬프트 사용자 가이드 – 글쓰기편
챗GPT와 달리3: ①이미지 생성 가이드라인 소개
달리3(DALL·E) 사이트 먼저 이미지 작업을 시도해본다
기존의 챗GPT와는 다르게 이미지 생성에는 약간의 차이점이 있었다. 챗GPT에서는 대화 내용이 조금 틀려도 원하는 텍스트를 수정하여 요청하면 되었지만, 이미지의 경우 수정 작업이 그렇게 단순하지 않다. 따라서 원하는 이미지를 처음부터 정확하게 생성하는 것이 중요하다. 또한, 제공된 기본 이미지를 통해 프롬프트의 사용 방법에 대한 이해가 필요하다.
이렇게 시도함으로써 어떤 프롬프트를 사용할 때 어떤 이미지가 생성되는지 경험을 통해 알게 될 것이다. 실제로 시도해보면서 프롬프트의 사용법을 체감해보는 것을 추천한다.
링크 : https://openai.com/dall-e-3
프롬프트: An illustration of an avocado sitting in a therapist’s chair, saying ‘I just feel so empty inside’ with a pit-sized hole in its center. The therapist, a spoon, scribbles notes.
프롬프트: An ink sketch style illustration of a small hedgehog holding a piece of watermelon with its tiny paws, taking little bites with its eyes closed in delight.
달리3에서 이미지 프롬프트를 정리해서 제공한다
- 프롬프트: A paper craft art depicting a girl giving her cat a gentle hug. Both sit amidst potted plants, with the cat purring contentedly while the girl smiles. The scene is adorned with handcrafted paper flowers and leaves.
- 프롬프트: Photo of a lychee-inspired spherical chair, with a bumpy white exterior and plush interior, set against a tropical wallpaper.
- 프롬프트: Monochromatic blue, a mirror monolith standing in the desert, surreal, digital art, a small tiger is in front of mirror and big tiger is reflected, tighers are looking at each other
- 프롬프트: Black and white, cup of coffee, coffee plants nearby
프롬프트: A stylized portrait-oriented depiction where a tiger serves as the dividing line between two contrasting worlds. To the left, fiery reds and oranges dominate as flames consume trees. To the right, a rejuvenated forest flourishes with fresh green foliage. The tiger, depicted with exaggerated and artistic features, stands tall and undeterred, symbolizing nature’s enduring spirit amidst chaos and rebirth.
달리3를 통한 이미지 생성 방법을 어느 정도 이해하였다면, 특정 주제에 대한 내용을 요청하여 시도해볼 수 있다. 아래 이미지는 다음 주에 진행할 강의 자료 중 일부이다. 이 자료의 일부 내용을 소개하고자 달리3을 통해 요청하여 작업하였다.
프롬프트 : Wide illustration, white background, one child learning bicycle, physical education teacher supporting from behind, please don’t put any other image in the background
프롬프트 : Wide illustration, middle-aged man who has difficulty moving, man who assists and helps exercise, white background, please do not put any images other than the background
달리3(DALL·E)의 이미지 생성 가이드라인을 소개한다
DALL·E를 통해 이미지를 생성할 때에는 텍스트 기반의 설명으로 원하는 이미지의 세부 사항을 지시한다. 이 텍스트 설명을 ‘프롬프트’라고 부르며, DALL·E는 해당 프롬프트를 해석해 그에 맞는 이미지를 생성한다. 효과적인 프롬프트 작성을 위한 주요 지침은 다음과 같다
- 구체성: 이미지의 세부사항을 명확하게 기술한다.
예시로, “나무 아래에 앉아 있는 고양이”보다 “가을 나무 아래에 앉아 있는 검은색 고양이”와 같이 구체적으로 작성하는 것이 효과적이다.
- 사이즈 (Size):
- “1024×1024” (1:1, 정사각형)
- “1792×1024” (와이드, 약 16:9 비율)
- “1024×1792” (톨, 약 9:16 비율)
- 이미지 타입:
- Photo: 실제 사진처럼 보이는 이미지
- Oil Painting: 기름물감 그림 스타일의 이미지
- Watercolor Painting: 수채화 스타일의 이미지
- Illustration: 일반적인 그림 또는 일러스트 스타일
- Cartoon: 만화 스타일
- Drawing: 손그림 스타일
- Vector: 벡터 그래픽 스타일
- Render: 3D 렌더링 스타일
- 인물의 특징 및 배경:
- 인물의 성별, 피부색, 헤어스타일, 옷차림 등의 특징을 명시할 수 있다.
- 배경의 색상, 물체, 풍경, 시간대 (낮/밤) 등을 명시할 수 있다.
- 텍스트 포함:
- 이미지 내에 원하는 텍스트를 포함시킬 수 있다. 이때 텍스트의 내용, 폰트, 크기, 위치 등을 명시할 수 있다.
- 프롬프트: A teddy bear, text “I’m good”, in a 3D speech bubble
- 색상 지정:
- 원하는 색상을 특정 요소에 적용하고 싶을 때, 예를 들면 “빨간색의 자동차” 또는 “하늘색 배경의 일러스트”와 같이 색상을 명시적으로 지정할 수 있다.
- 복잡도 조절:
- “간단한”, “상세한” 또는 “복잡한”과 같은 단어를 사용하여 이미지의 복잡도를 조절할 수 있다. 이를 통해 이미지의 세부사항의 양을 조절할 수 있다.
- 감정과 표정:
- 인물이나 동물의 표정 또는 감정 상태를 명시할 수 있다. 예를 들면 “행복한 개”, “슬픈 여성” 등과 같이 표정을 지정하여 요청할 수 있다.
- 작품 스타일 지정:
- 특정 화가의 스타일이나 예술 운동 (예: 인상주의, 초현실주의 등)을 참조하여 이미지 스타일을 지정할 수 있다. 그러나 최근의 작가나 예술가의 스타일을 직접적으로 참조할 수는 없다.
- 복수의 객체:
- 여러 개의 객체를 포함하고 싶을 경우, 각 객체를 명시적으로 나열하여 프롬프트를 작성할 수 있다. 예: “빨간색 사과와 초록색 배 옆에 파란색 바나나”.
- 조합과 상호작용:
- 두 개 이상의 객체가 특정 방식으로 상호작용하거나 조합되어 표현되길 원한다면, 그 상호작용을 명시적으로 설명할 수 있다. 예: “고양이가 피아노를 연주하는 모습” 또는 “나무 위에 앉아 있는 새”.
DALL·E는 한글로 요청 시 오류 발생한다
DALL·E는 다양한 언어를 지원하여 한글로도 이미지 생성이 가능하다. 그렇지만 DALL·E의 학습 데이터셋은 주로 영어 텍스트를 중심으로 구성되어 있어, 영어로 작성된 프롬프트가 더 높은 정확도를 보일 수 있다.
명확하게 구체화된 한글 프롬프트로도 원하는 이미지를 잘 생성할 수 있다. 그러나 복잡하거나 특정 문화적 맥락에 깊게 연결된 내용을 요청할 때는 영어로 변환하여 요청하는 것이 좋다.
한글로 요청했을 때 원하는 결과를 얻지 못할 경우, 아래와 같은 이미지가 출력될 수 있다. 이 경우, 프롬프트를 영어로 바꾸어 요청하면 더 정확한 이미지를 얻을 수 있다
해당 문서에 대한 추가 참고자료
- 온라인강좌: ③달리(DALL-E): 초보자를 위한 이미지 생성 가이드(입문편)
- 온라인강좌: ②챗GPT 비즈니스 글쓰기: 당신의 업무 비서가 되는 방법 (입문편)
- 전자책: ⑤챗GPT 글쓰기, 나만의 글쓰기 스타일 만드는 법
- 강의: ④생성형 AI를 활용한 숏폼 영상 제작 강좌
- 강의: ⑤챗GPT를 활용한 비즈니스 글쓰기와 이미지 최적화 워크샵
- 강의: ⑥챗GPT와 DALL-E로 비즈니스 이미지 전략 실전 활용하기