생성형AI/챗GPT 달리3(DALL-E)

챗GPT와 달리3: ②이미지 생성을 위한 프롬프트 사용법

글쓰기와 그림 그리기, 두 영역에서 모두 능숙하다면 어떤 시너지가 발생할까? 이러한 물음에 대한 탐색을 위해, 저는 챗GPT와 달리3(DALL·E)의 통합 사용에 도전하고 있다. 본 글에서는 달리3을 활용한 이미지 생성에 초점을 맞추어 프롬프트 작성에 관한 분석적인 논의를 진행하려 한다.

달리3와의 초기 만남은 물론 흥미로웠으나, 실제 작업을 시작하면서는 다소 답답함을 느꼈다. 그 이유는, 글쓰기에 익숙한 반면 그림 그리기에는 미숙함에서 비롯된 것이다. 이러한 상황은 초기 몇 일 동안 저에게 작은 스트레스로 다가왔다.

먼저 소개한 “챗GPT와 달리3: ①이미지 생성 가이드라인 소개” 내용에 이어 두번째로 글을 작성한다.

달리3(DALL·E) 왜 관심을 갖는가?

비즈니스 환경에서 달리3는 다양한 분야에 제공하게 될거다. 우선, 광고 캠페인에서 브랜드 아이덴티티에 부합하는 이미지를 생성하거나, 제품 디자인 초기 단계에서 개념을 즉각적으로 시각화할 수 있다. 또한, 복잡한 데이터를 인포그래픽으로 변환하여 회의나 프레젠테이션에서 효과적으로 메시지를 전달할 수 있다. 내부 커뮤니케이션에도 도움을 주며, 블로그나 웹사이트에 고유한 컨텐츠를 제작할 수 있다. 이러한 다양한 활용 가능성 때문에 해당 툴은 다양한 비즈니스 환경에서 빠르게 확산되어 기본적인 도구로 자리잡을 것으로 예상된다.

이미지 생성을 위한 달리3(DALL·E)에서 프롬프트를 사용법

초반에는 챗GPT를 활용한 텍스트 작업 방식을 그대로 적용하려 했으나, 이미지 생성에 있어서는 이와 다른 접근법이 필요하다는 것을 알게 되었다. 이를 인식하고 달리3의 공식 홈페이지에서 권장하는 방법을 적용하게 되었다. 예를 들어, Adobe Photoshop에서 레이어를 활용하여 복잡한 이미지를 작성하는 것처럼, 달리3에서도 다양한 상황과 요소를 종합적으로 고려해야 한다.

달리3(DALL·E) 홈페이지에서 제공되는 이미지 예제 분석하기

달리3 홈페이지: https://openai.com/dall-e-3

해당 이미지를 생성하기 위해 사용된 프롬프트는 아래에 주어진 4개의 문장으로 구성되어 있다. 단순한 한두 줄의 상황 설명이 아니라, 각 문장에서 구체적인 내용과 의도를 명확하게 전달해야만 원하는 결과를 얻을 수 있다.

  • ①The grumpy vendor, a tall, sophisticated man, is wearing a sharp suit, sports a noteworthy moustache and is animatedly conversing on his steampunk telephone.
    • 키가 크고 세련된 남자인 이 심술궂은 상인은 날카로운 정장을 입고 주목할만한 콧수염을 뽐내며 스팀펑크 전화로 활기차게 대화를 나누고 있습니다.
  • ②At the corner stall, a young woman with fiery red hair, dressed in a signature velvet cloak, is haggling with the grumpy old vendor.
    • 코너의 노점에서는 특유의 벨벳 망토를 입은 불타는 빨간 머리의 젊은 여성이 심술궂은 늙은 상인과 흥정을 하고 있습니다.
  • ③The sidewalks bustling with pedestrians enjoying the nightlife.
    • 밤을 즐기는 행인들로 북적이는 보도.
  • ④A bustling city street under the shine of a full moon.
    • 보름달이 비추는 번화한 도시의 거리.

기본으로 제공하는 이미지를 분석하면 다음 네 가지 사항을 고려하고 있었다.

  • 사람 또는 사물 표현1: 대상의 종류와 위치 등을 명확하게 정의한다.
  • 사람 또는 사물 표현2: 또 다른 대상에 대한 정보를 제공한다.
  • 주변상황: 배경이나 상황에 대한 설명을 추가한다.
  • 시점: 시간, 빛 등의 요소를 표현하여 이미지의 분위기를 설정한다.

이렇게 구성된 프롬프트는 단순한 그림을 넘어, 다양한 상황과 요소를 통합적으로 표현할 수 있게 해준다.

이러한 방식은 달리3를 통한 이미지 생성에 있어 체계적인 접근이 가능하게 하며, 더욱 복잡하고 다양한 작업을 진행할 수 있다는 점에서 가치가 있다.

달리3을 이용해 이미지를 생성할 때에는 이러한 세부 사항을 반드시 고려해야 한다

  • 1. 주제: 그림의 주제나 핵심 내용은 무엇인지 설명 한다
  • 2. 시각적 요소: 그림에 포함될 주요 시각적 요소 설명 한다 (예: 배경, 주요 객체, 색상 등)
  • 3. 상세 설명: 각 요소에 대한 상세한 설명 제공 (예: 특정 색상의 하늘, 구름의 모양, 나무의 종류 등)
  • 4. 순서와 구조: 그림의 전체적인 구성이나 배열에 대한 설명을 제공한다
  • 5. 스타일과 텍스처: 원하는 그림의 스타일과 텍스처를 설명한다 (예: 실사, 수채화 등)
  • 6. 기타 특이사항: 그림에 추가하거나 특별히 고려해야 할 점이 있다면 설명 한다

이러한 양식을 따라 질문을 작성하시면, 원하는 그림을 더 정확하게 생성하는 데 도움이 될 것입니다.

달리3(DALL·E)에서 배운 지침에 따라 이미지 프롬프트 사용하기

최근에 지방 출장이 빈번해져 KTX 이용이 잦아졌다. 대구로 내려가는 길에 눈에 띄는 잡지 이미지를 보고 스마트폰에서 작업을 시도해 보았다.

KTX 잡지 표지

달리3을 이용하여 이미지를 생성할 때 한글도 지원되지만, 오류를 최소화하기 위해 가능하면 영문으로 요청하는 것이 더욱 명확하다.

프롬프트: 와이드 사진, 바닷가 모래사장에 피아노 한대가 있다. 바다는 잔잔한 파도가 있고, 주변에 사람들이 없다.
해당 내용을 번역해서 달리에게 요청해줘

초반에 이런 이미지가 나옴

프롬프트: 와이드 사진, 바닷가 모래사장에 클래식 피아노 한대가 있고, 한명의 남자가 피아노 치고 있다. 피아노는 20미터 거리고, 모두 열려져 있으며, 측면으로 바라봄. 모래사장은 가로로 펼쳐져 있으며, 바다는 잔잔한 파도가 있고, 주변에 사람들이 없다.

해당 문서에 대한 추가 참고자료

Leave a Comment

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

*