생성형AI/챗GPT 달리3(DALL-E)

챗GPT와 달리3: ⑩일반적인 오류 해결 ‘사람 인원 수’

달리3(DALL-E)를 활용한 이미지 생성의 수요가 증가함에 따라, 복잡한 이미지 요청에 대한 결과가 예상과 다르게 나타나는 일이 자주 발생한다. 이 글에서는 이와 같은 일반적인 오류들을 해결하기 위한 방법을 소개하고자 한다.

이러한 오류에는 사람 인원 수의 불일치, 글자 생성 오류, 배경의 단순화 요청 처리 문제 등이 포함될 수 있다. 본문에서는 이러한 문제들을 하나씩 짚어보고, 그 해결책을 체계적으로 설명할 예정이다. 이를 통해 보다 정확하고 만족스러운 이미지 생성 결과를 얻을 수 있도록 도울 것이다.

해당 내용은 인프런 달리 강좌의 “섹션 5 유용한 팁 : ②사람 인원수에 맞게 이미지 생성하기” 세션에서도 소개되었으며, 여기에서 간략하게 소개한다.

달리3(DALL-E) 이미지 생성 시 일반적인 오류 해결: ①사람 인원 수

달리3(DALL-E)에서 이미지를 생성할 때, 한 번에 원하는 이미지가 나왔다고 해서 프롬프트가 적합하다고 가정해서는 안 된다. 같은 프롬프트로 여러 번 시도하여 일관된 유형의 이미지가 생성되면 그 프롬프트가 적합하다고 볼 수 있겠지만, 그렇지 않다면 프롬프트를 명확하게 수정하는 것이 중요하다.

기본 이미지 생성 방법

——
프롬프트 : 일러스트로 세 명의 사람이 공원 벤치에 앉아 있으며, 한 명은 책을 읽고, 두 명은 서로 이야기를 나누고 있는 모습의 이미지를 만들어 주세요. 배경은 봄꽃이 만개한 공원으로 해주세요
——

이처럼 여러 명의 이미지 생성이 자주 발생하게 된다. 이때는 프롬프트 수정 작업이 필요하다.

인원 수에 맞춘 이미지 생성 프롬프트: 예시1

인원 수에 맞게 수정 요청을 반복했음에도 불구하고 결과가 만족스럽지 않다면, 아래와 같은 방법으로 프롬프트를 요청하는 것이 좋다.

——
프롬프트: 해당 프롬프트 보면, ‘일러스트로 세 명의 사람이 공원 벤치에 앉아 있으며, 한 명은 책을 읽고, 두 명은 서로 이야기를 나누고 있는 모습의 이미지를 만들어 주세요. 배경은 봄꽃이 만개한 공원으로 해주세요” 정확하게 3명이라고 명시 했는데 제대로 나오지 않는 결과가 있는데, 이를 해결 할 방법을 제공해줘요
——

이와 같이 프롬프트를 요청하면, 다음과 같은 결과를 얻을 수 있다.

이제 프롬프트를 약간 조정하여 원하는 내용을 다시 요청해 본다.

여기서 규칙은 요청을 통해 얻은 내용이며, 이는 조금씩 다를 수 있다.

——
프롬프트: 달리 이미지 생성을 위한 [규칙] 을 제공해 주었는데, [프롬프트1]을 [규칙]에 적용해서 [프롬프트2] 을 작성해줘

[규칙]

내용 넣기

[프롬프트1] 내용 넣기

[프롬프트2] 내용 넣기
——

이를 통해 [프롬프트2] 제공 해준다.

제공해준 [프롬프트2] 로 이미지 생성해본다.

이 방법을 사용하면 이전보다 더 정확한 이미지를 생성할 수 있다. 그러나 한 번에 좋은 결과가 나오지 않을 수도 있다

인원 수에 맞춘 이미지 생성 프롬프트: 예시2

예시1과 동일한 방식으로 새로운 예시 작업을 했으며, [규칙]을 통해 원하는 프롬프트 요청을 동일하다.

——
프롬프트 : 일러스트 작성해줘, 사무실 회의실에서 3명의 회의를 하고 있습니다. 남성 1명, 여성2명이고, 서로 진지하게 토론을 하고 있습니다
——

해당 내용으로 이미지 생성을 했다. 하지만 남성 2명, 여성 1명으로 해주었고 이후 여러번 해봐도 정확하게 나오지 않아서 프롬프트 요청을 했다. 이후 명확한 프롬프트 제공해주어 원하는 이미지 생성할 수 있었다. (여러장 이미지 확인요)

프롬프트 요청을 통해 더 정확한 값을 찾아내고, 일부 수정을 거쳐 아래와 같은 프롬프트를 생성했다.

프롬프트 : 일러스트 스타일로, 현대적인 사무실 회의실에서 세 명의 직원이 진지한 토론을 하고 있는 상세한 이미지를 만들어 주세요. 한 남성 직원은 캐주얼하게 입고, 회의실에서 프레젠테이션을 하고 있습니다. 두 여성 직원은 회의 테이블의 한쪽에 앉아 있으며, 한 여성은 분홍색 블라우스를 입고 노트북으로 기록을 하고 있고, 다른 여성은 파란색 정장을 입고 서류를 검토하고 있습니다. 회의실은 넓고 밝으며, 벽에는 창문이 있고, 테이블 위에는 프로젝터와 필기도구가 놓여 있습니다.

약간의 오류는 있지만, 그래도 상황을 어느 정도 반영하는 이미지를 생성해주었다.

참고 할 만한 주요 자료

Leave a Comment

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

*