생성형 AI 주요 소식에 대한 정기적인 업데이트를 시작합니다. 이번 글에서는 2024년 11월 중순까지의 주요 동향과 함께, 생성형 AI 분야에서 주목할 만한 이슈를 다룹니다. 앞으로도 지속적으로 최신 변화와 트렌드, 그리고 실제 사례를 소개하며 독자들에게 실질적인 정보를 제공하겠습니다.
DALL-E 4의 출시와 관련된 정보는 아직 구체적으로 공개되지 않았지만, 2024년 말에서 2025년 초 사이에 출시될 가능성이 높다는 관측이 있습니다. 올해 초 영상 기반 AI 서비스인 ‘소라’도 많은 기대를 모았지만, 현재까지 출시 소식이 없어 아쉬움을 남기고 있습니다. 커뮤니티에서는 기술적 한계로 인해 소라 서비스의 올해 출시가 어려울 것이라는 전망도 나오고 있습니다.
DALL-E 3의 출시 당시, 이미지 생성에서 혁신적인 기술을 선보이며 주목받았습니다. 특히, 챗GPT 창에서 자연어로 이미지를 생성하는 기능은 사용성을 크게 개선해 사용자들에게 큰 호응을 얻었습니다. 하지만 이후 에디터 버전의 소폭 개선 외에는 더 이상의 큰 변화가 없었습니다. 반면, 미드저니는 꾸준히 최신 버전을 출시하며 사용자 경험을 향상시키고 있습니다. 특히, 올해 12월에는 버전 7을 제공 예정이며 여기서는 ‘이미지 to 비디오’ 기능을 포함한 영상 버전을 선보일 예정으로, 두 서비스의 발전 속도 차이는 뚜렷하게 드러납니다.
Midjourney V7의 주요 기능: 12월 출시 예정
- 이미지 품질 및 프롬프트 이해도 대폭 향상: 더욱 사실적이고 자연스러운 이미지 생성, 복잡한 프롬프트 해석 능력 개선
- 개인화 모델 도입: 사용자 개인의 선호도를 반영한 이미지 생성 기능 기본 설정으로 활성화
- 영상 및 3D 모델 생성 기능 추가: 연말 영상 생성 기능 출시 목표, NeRF 유사 포맷을 활용한 3D 모델 개발 진행 중
AI 영상 분야는 올해 7월 이후 빠르게 발전하고 있습니다. 다양한 기업들이 새로운 기능을 포함한 업데이트를 지속하며, AI 기술은 점점 더 많은 산업에서 활용되고 있습니다. 최근 코카콜라의 광고 영상 제작에도 AI 기술이 사용된 것으로 알려지면서, AI 영상의 상업적 활용 가능성이 주목받고 있습니다.
- 런웨이 (Runway) : Gen-3 Alpha Turbo 모델로 기존보다 7배 빠른 영상 생성 속도 구현, Video-to-Video 기능으로 기존 영상을 새로운 스타일로 변환 가능
- 루마 드림머신 (Luma Dream Machine) : 텍스트와 이미지로 5초 길이의 720p 해상도 고품질 영상 생성 (4K 업스케일 가능), 무료 버전으로 월 30회 영상 생성 제공, 실시간 영상 생성 기능 개발 중
- 클링 (Kling) : 텍스트-이미지-비디오 통합 생성 AI 서비스 제공, 일부 영역에서 루마 드림머신보다 우수한 결과물 생성
이번 코카콜라 AI 영상은 “AI Technologies Used Primary Models: Leonardo, Luma, Runway, Kling. Additional Models: OpenAI’s Sora and Minimax” 모든 것을 활용해서 제작을 했습니다.
저는 AI 이미지와 영상 기술에 관심을 가지고 관련 도구들을 직접 사용하며, 이를 기업 환경에 적용해 왔습니다. 특히, 중소기업들은 기존의 고비용 장벽으로 인해 AI 기술 도입이 어려웠지만, 이제는 합리적인 비용으로 접근할 수 있는 환경이 마련되었습니다. 대기업들 또한 AI 기술의 도입을 점진적으로 준비 중입니다.
- 이미지, 비디오, 텍스트 등 다양한 형태의 콘텐츠를 저비용으로 생성 가능
- 전문 디자이너나 영상 제작자 없이도 높은 수준의 콘텐츠 제작 가능
AI 기술은 이미지와 영상의 경계를 허물며 새로운 가능성을 열고 있습니다. 앞으로의 발전이 사용자와 기업 모두에게 어떤 가치를 더해줄지 기대됩니다.