본문 바로가기

say와 AI 챗봇친구 만들기 보고서

DALL·E 3을 사용하여 ChatGPT로 AI 이미지를 생성하는 방법

728x90
반응형
SMALL

 

DALL·E 3을 사용하여 ChatGPT로 AI 이미지를 생성하는 방법

 
 

DALL·E 2는 2020년대 가장 중요한 기술 제품 중 하나로 간주될 가능성이 높으며 현재의 생성 AI 열풍을 촉발한 것은 부인할 수 없습니다. 그러나 2022년 출시된 이후 Stable Diffusion 및 Midjourney 와 같은 다른 이미지 생성기는 점점 더 인상적인 AI 아트를 만들어 왔습니다. 지난 6개월 정도 동안 DALL·E가 뒤쳐지는 느낌이 들었습니다.

하지만 이제 DALL·E 3이 출시되면서 상황이 달라졌습니다.

DALL·E 3란 무엇입니까?

DALL·E 3 은 OpenAI의 AI 아트 생성기의 최신 버전입니다. 사용 방법과 생성할 수 있는 품질 모두에서 DALL·E 2에 비해 대폭 업그레이드되었습니다. 다시 한번, 사용 가능한 다른 모든 AI 이미지 생성기와 정면으로 맞설 수 있습니다. 

사용하는 모든 앱에서 AI 이미지 만들기
AI 이미지 생성 자동화
어떻게하는지 배우다

가장 큰 변화는 DALL·E 3가 적어도 당분간은 더 이상 독립형 앱이 아니라는 것입니다. 대신 ChatGPT와 통합되어 있습니다. 이렇게 하면 사용하기가 더 쉬워지지만 AI 기반 도구에서 기대할 수 있듯이 여전히 몇 가지 단점이 있습니다.

그럼 파헤쳐 보겠습니다. 

먼저 ChatGPT Plus에 가입하세요.

현재 DALL·E 3는 ChatGPT Plus 가입자에게만 제공됩니다. 액세스 하려면 ChatGPT 계정에 가입한 다음 왼쪽 사이드바 하단에 있는 플러스로 업그레이드를 클릭하세요. 월 20달러 ChatGPT Plus 구독 요금제를 선택하고 결제 세부정보를 입력하면 준비가 완료됩니다.

지금까지 DALL·E 3는 GPT-4와 동일한 한도를 갖고 있는 것으로 보입니다. 즉, 3시간마다 50개의 요청을 보낼 수 있습니다. 이론적으로 이는 하루에 수천 개가 넘는 이미지를 생성할 수 있음을 의미합니다. 전체적으로 가격이 일관되지는 않지만 Dream Studio(Stable Diffusion 사용) 또는 Midjourney와 같은 AI 이미지 생성기를 사용하여 일반적으로 얻는 것보다 훨씬 더 많은 것입니다. 그리고 여러분이 일상적으로 그렇게 많은 프롬프트를 확인하기 시작한다면 OpenAI가 할 말이 있을지도 모릅니다. 

ChatGPT Plus에 가입하지 않고 DALL·E 3을 사용해 보려면 Bing Image Creator에서 테스트할 수도 있습니다. 동일한 수준의 제어 권한은 없지만 동일한 기본 모델을 사용합니다. 기술적으로는 무료로 사용할 수 있지만 이미지에 워터마크가 표시되어 있고 "부스트" 크레디트 시스템을 사용합니다. 할당량이 완료되면 Image Creator가 메시지를 렌더링 하는 데 시간이 더 오래 걸릴 수 있습니다.

DALL·E 3 시작하기

DALL·E 3에 액세스 하려면 ChatGPT로 이동하여 화면 상단의 GPT-4 위로 마우스를 가져가세요. 드롭다운 메뉴에서 DALL·E 3 Beta를 선택합니다.

그 후 DALL·E 3을 사용하는 것은 ChatGPT를 사용하는 것과 같습니다. 일반 텍스트 프롬프트를 입력하거나 자연어를 사용하여 상호 작용할 수 있습니다. 각 프롬프트는 선택할 수 있는 4가지 이미지를 제공합니다. 

시도해 볼 사항은 다음과 같습니다.

  • "작은 들판에 있는 큰 소의 입체파 그림"
  • "우주복을 입고 달에 있는 원숭이를 그린 유화"
  • "인상파 그림 스타일로 사슴을 타고 단풍나무 숲을 지나는 캐나다 남자"
  • "원격으로 일하는 아일랜드 남자의 스톡 사진"

DALL·E 3의 차별화된 기능 중 하나는 프롬프트에 따라 자동으로 개선되고 반복된다는 것입니다. 또한 생성되는 4개의 이미지 각각에 대해 약간 다른 프롬프트를 사용합니다. 

예를 들어, "작은 들판에 있는 매우 큰 보라색 소의 입체파 그림"을 입력했을 때 DALL·E 3는 실제로 다음 프롬프트를 사용했습니다.

  • "작은 들판을 지배하는 거대한 보라색 소를 보여주는 입체파 그림으로, 조각난 기하학적 모양이 그 형태를 강조합니다."
  • "제한된 초원을 배경으로 각진 모양으로 구성된 커다란 보라색 ​​소를 묘사한 입체파 스타일의 유화입니다."
  • "제한된 잔디밭 중앙에 서 있는 왜곡된 크기의 특대 보라색 소를 묘사한 입체파 방식의 예술 작품입니다."
  • "분리된 평면과 각도로 이루어진 볼륨감 있는 보라색 소가 작은 들판에서 눈에 띄게 돋보이는 입체파 작품입니다."

DALL·E 3가 이미지에 대한 프롬프트로 무엇을 사용했는지 보려면 해당 항목을 클릭하기만 하면 됩니다. 생성하려고 시도한 내용이 프롬프트 상자에 나타납니다. 

이미지를 다운로드하려면 해당 이미지 위에 마우스를 놓고 왼쪽 상단에 있는 다운로드 아이콘을 클릭하세요.

 

ChatGPT로 DALL·E 3을 조종하는 방법

DALL·E 3 사용의 가장 좋은 점은 ChatGPT를 통해 자연어 요청에 대한 후속 조치를 취할 수 있다는 것입니다. 마음에 들지 않는 부분이나 다른 결과로 강조하고 싶은 부분이 있다면 요청하시면 됩니다. 

내가 시도한 것 중 일부는 다음과 같습니다.

  • 하나의 특정 이미지에 대해 더 많은 변형을 요청하는 경우
  • 각 이미지의 시점 변경
  • 각 이미지에서 피사체가 나타나는 위치 변경
  • 각 이미지의 화면 비율 변경
  • 각 이미지의 피사체 수 변경
  • 색상, 크기 등 피사체 세부정보 추가, 제거, 수정
  • 배경 세부정보 추가 및 제거
  • 생성된 작품을 갤러리 벽에 걸기

불행하게도 현재 DALL·E 3는 직접 편집하는 대신 귀하의 요청에 따라 새로운 프롬프트를 생성한 다음 새로운 이미지 세트를 생성합니다. 때로는 두 이미지 사이의 변화가 사소하고 정확히 원하는 대로 될 수도 있습니다. 그런 일이 발생하면 마치 마법처럼 느껴집니다. 그러나 어떤 경우에는 DALL·E 3가 특정 이미지에서 마음에 드는 부분을 버릴 수도 있습니다. 

그럼에도 불구하고 DALL·E 3를 사용하여 원하는 것을 정확하게 제공하는 프롬프트를 미세 조정하는 것은 DALL·E 2에서 했던 것처럼 시행착오에 의존하는 것보다 훨씬 쉽고 효율적입니다. ·E 3은 또한 계속해서 재즈를 더하고 더욱 흥미롭고 연상적인 프롬프트를 제공합니다. 

 

DALL·E 3으로 최상의 결과를 얻는 방법

DALL·E 3은 아직 베타 버전이지만 이를 통해 훌륭한 결과를 얻을 수 있습니다. 특히 DALL·E 3는 사실적인 이미지보다는 드로잉, 페인팅, 기타 예술 작품을 만드는 데 탁월하다는 것을 알았습니다. 최상의 결과를 얻는 데 도움이 되도록 염두에 두어야 할 몇 가지 사항은 다음과 같습니다.

자세한 프롬프트 제공

DALL·E 3를 사용하면 많은 내용을 자체적으로 추정하여 간단한 프롬프트를 더 쉽게 사용할 수 있지만 특정 이미지를 원할 경우 프롬프트에 많은 세부 정보를 추가하세요. 예를 들어 아래 스크린숏은 내 프롬프트로 시작되었습니다.

"해적 복장을 한 벨기에 말리노이즈가 다른 배와의 치열한 해적 전투에서 자신의 배를 지휘하는 모습을 아주 세밀하게 그린 유화입니다. 그는 트라이콘 모자를 쓰고 권총을 들고 선원들에게 명령을 외칩니다. 바다는 무겁고 비가 내립니다. 모든 것이 약간 혼란스럽습니다. 어둡고 변덕스러운 색상입니다. 그가 살아남을 수 있을지 궁금합니다."

꽤 좋지요?

DALL·E 3는 숫자와 위치를 이해합니다.

프롬프트에 엄청나게 많은 세부 정보를 추가하여 DALL·E 3에 과부하를 걸 수는 있지만 DALL·E 2에서보다 훨씬 어렵습니다. 그리고 여전히 완벽하지는 않지만 DALL·E 3는 숫자와 이미지 내 다양한 ​​요소의 위치 등이 있습니다.

예를 들어 전경이나 이미지 왼쪽에 무언가를 생성하도록 요청할 수 있으며 대부분 그렇게 할 것입니다. 마찬가지로, 특정 개수의 항목을 요청하면 정답을 맞히는 경우가 더 많습니다.

미묘한 변화를 요청하세요

DALL·E 3에 결과 중 하나를 기반으로 변형을 요청하면 때로는 초기 프롬프트가 상당히 크게 변경될 수 있습니다. 좀 더 유사하게 유지하고 싶다면 "미묘한 변형"을 만들어 달라고 요청하세요. 이것이 완전히 새로운 이미지를 생성하는 것을 막지는 못하지만 초기 프롬프트를 덜 변경한다는 것을 알았습니다. 

3시간마다 50개의 요청은 많은 양입니다.

이 기사를 작성하기 위해 이틀에 걸쳐 DALL·E 3을 여러 번 테스트했는데 한 번도 한계에 부딪힌 적이 없습니다. 시간을 내어 무엇을 해야 할지 알려주고 각 이미지를 살펴보세요. 실제로 시도하지 않고는 한계에 도달할 가능성이 없습니다. 

신나게 놀고 놀아보세요

진지하게, DALL·E 3의 기능과 불가능한 기능을 실제로 파악하는 유일한 방법은 직접 사용해 보는 것입니다. ChatGPT는 제가 정말 어려움을 겪을 것이라고 생각했던 몇 가지 요청을 처리할 수 있었지만, 단순한 변경이라고 생각했던 것도 완전히 망쳐 놓았습니다.

DALL·E에서 더 많은 것을 얻으세요

DALL·E 3는 최고의 이미지 생성기 중 하나이지만 ChatGPT를 통해 사용하는 것은 모든 작업 흐름에 적합하지 않습니다. API를 통해 요청을 보내거나 인페인팅 및 아웃페인팅과 같은 고급 기능을 시험해보고 싶다면 DALL·E 2를 계속 사용할 수 있습니다.

그리고 DALL·E를 Zapier에 연결하면 AI 이미지 생성을 자동화하여 가장 많이 사용하는 다른 앱에서 바로 이미지를 생성할 수 있습니다. AI 이미지 생성을 자동화하는 방법에 대해 자세히 알아보거나 다음 워크플로 중 하나를 시작해 보세요.

 

ChatGPT의 DALL·E3 사용법

지난 9월 21일, OpenAI는 이미지 생성 AI 'DALL·E3'를 발표하였습니다. 이후 Bing Image Creator를 통해 이 기술을 체험해 볼 수 있었으나, ChatGPT 내에서는 사용할 수 없는 상태였습니다. 10월 5일부터 ChatGPT Plus 및 Enterprise 사용자들을 대상으로 DALL·E3의 사용이 순차적으로 공개되기 시작했습니다. DALL·E3의 상세 내용은 아래 글을 참고하시기 바랍니다.

 

OpenAI DALL·E 3 발표: ChatGPT와 통합으로 이미지 생성 AI의 진화

최근 몇 년 동안 AI(인공지능) 분야는 빠른 속도로 발전하고 있으며, 그 중심에는 이미지 및 텍스트 생성 기술이 있습니다. 이미지 생성 영역에서는 Midjourney, leonardo.ai, Adobe Firefly와 같은 다양한

yunwoong.tistory.com

이 글에서는 ChatGPT를 통해 DALL-E 3을 어떻게 활용하는지에 대한 방법을 설명드리겠습니다. 만약 아직 이 기능에 접근할 수 없는 사용자들은 Bing Image Creator를 통해 DALL-E 3을 체험해 볼 수 있습니다.

 

Microsoft Bing Image Creator 공개

2023년 3월 23일 Microsoft는 향상된 DALL·E 모델을 기반으로 하는 이미지 생성기 Bing Image Creator를 발표했습니다. Create images with your words - Bing Image Creator comes to the new Bing - The Official Microsoft Blog Last month

yunwoong.tistory.com


ChatGPT에서 DALL·E3 사용하기

DALL·E3를 활성화하는 방법은 간단합니다. GPT-4 하위 항목에서 'DALL·E3 (Beta)'를 선택하면 됩니다. 이것으로 준비는 끝났습니다.

사용자가 프롬프트를 입력하면, ChatGPT는 해당 내용을 유틸라이즈 하여 4가지 방식으로 이미지를 자동 생성합니다.

기다리면 잠시 뒤 결과가 나옵니다.

클릭하면 이미지를 상세히 볼 수 있습니다.

1) 한글 프롬프트

이전의 이미지 생성 모델들은 영어로만 프롬프트를 작성해야 했습니다. 이로 인해 사용자들은 번역기를 통해 영어로 변환한 후 복사하여 붙여 넣는 등의 번거로운 과정도 있지만 더 힘든 것은 언어의 장벽을 뛰어넘어 더 나은 결과물을 얻기 위해 프롬프트를 디자인해야 했습니다. DALL·E 3의 가장 놀라운 발전은 한글을 비롯한 여러 다른 언어로 프롬프트를 입력하면 이미지를 생성할 수 있게 되었다는 점이고, 사용자는 자유롭게 서술형태로 프롬프트를 작성하여 결과를 얻을 수 있습니다.

2) 수정 및 보완

만약 생성된 이미지 중 특정 부분이 마음에 들지 않는다면, 그 부분에 대한 수정을 요청하실 수 있습니다. 그러나 매번 요청할 때마다 이미지는 새롭게 생성되므로, 이전에 보셨던 이미지와는 배경이나 디자인이 약간 다를 수 있습니다. 하지만 어느 정도의 일관성을 보장되는 것 같습니다.

3) 비율 지정

이미지의 가로와 세로 비율을 원하는 대로 지정할 수 있습니다.

4) 이미지에 Text 문구 추가

"Text '문구'"와 같은 형태로 프롬프트를 입력하면, 해당 문구를 이미지 상에 나타낼 수 있습니다. 하지만 DALL·E 3도 항상 텍스트를 완벽하게 이미지화하는 것은 아닙니다. 정확한 문구 표현을 위해 동일한 프롬프트를 사용하여 여러 번 이미지 생성을 시도해야 할 수도 있습니다. 아직 한글이나 다른 언어는 잘되지 않습니다.

DALL·E 3는 안전성과 창작자의 권리를 중요하게 생각합니다. 그래서 현재 활동 중인 아티스트의 특정 스타일로 이미지를 생성하거나, 유명한 인물의 모습을 묘사하는 것과 같은 요청을 받았을 때, 이를 거부하는 기능이 내장되어 있습니다. 이를 통해 창작자의 권리 보호와 함께 사용자의 안전한 사용을 지원하고 있습니다.


이미지를 이용해 프롬프트 생성하기

이미지를 업로드하여 그와 유사한 이미지를 생성하기 위한 프롬프트를 얻는 방법에 대해 안내드리겠습니다. 먼저, GPT-4의 메뉴에서 'Default' 항목을 선택해 주세요. 그 후, Text 입력창의 왼쪽에 위치한 이미지 업로드 버튼을 클릭하여 원하는 이미지를 업로드합니다.

업로드가 완료된 후 "이미지를 생성하기 위한 DALL-E3 프롬프트를 작성해 줘"라고 입력하면, 해당 이미지와 유사한 이미지를 생성할 수 있는 프롬프트를 제공받을 수 있습니다. 단, 완벽하게 동일한 이미지를 얻는 것은 어렵지만, 제공된 프롬프트를 통해 비슷한 이미지를 생성하는 것은 가능합니다.


DALL·E 3와 ChatGPT의 통합은 AI와 창작의 새로운 경계를 넓혀주고 있습니다. 사용자의 편의성과 창작자의 권리를 동시에 중요하게 생각하는 이 기술은 미래의 창작 활동에 큰 변화를 가져올 것으로 기대됩니다. 

 
 

 

728x90
반응형
LIST