본문 바로가기

say와 AI 챗봇친구 만들기 보고서

NVIDIA AI GauGAN으로 몇 초안에 스케치를 사실적 풍경으로 탄생

728x90
반응형
SMALL

NVIDIA AI GauGAN으로 몇 초안에 스케치를 사실적 풍경으로 탄생

엔비디아 AI 를 기반으로 획기적인 이미지 크리에이터 소프트웨어 GauGAN을 선보였는데요, 스케치를 몇 초안에 매우 사실적인 이미지로 만들어줍니다
 

반짝이는 호수에 투영된 눈 덮인 뾰족한 산봉우리의 모습. 초보 화가는 이런 멋진 일몰 풍경을 담아내기 위해 캔버스에 붓질을 합니다. 하지만 여러 색상의 물감이 덧대진 서투른 그림만 남게 되죠. 

엔비디아 리서치가 개발한 딥 러닝 모델 툴을 사용하면 누구나 멋진 그림 작업을 할 수 있답니다.

대충 그려도 입이 딱 벌어지는 사실적인 작품을 탄생시키죠. 이 도구는 GAN (Generative Adversarial Networks)이라고 불리는 생성적 적대 신경망을 활용해 분할 지도를 실제 같은 이미지로 변환시킵니다. 

 

이 모델을 사용한 인터렉티브 앱은 후기 인상파 대표 화가인 폴 고갱의 이름을 따 고갱(GauGAN)으로 불립니다. 


후기 인상파 화가 폴 고갱의 자화상. 1885년 作. 킴벨 미술관 소장 (이미지: 위키미디어)

 

GauGAN은 건축가, 도시 계획자부터 조경 설계자와 게임 개발자에 이르는 모든 이들에게 가상 세계를 만들 수 있는 강력한 도구를 제공할 수 있습니다. 현실 세계의 모습을 파악한 AI를 활용해 전문가들은 아이디어를 한층 수월하게 프로토타이핑 할 수 있으며 합성 장면으로 빠르게 전환시킬 수 있죠.

브라이언 카탄자로(Bryan Catanzaro) 엔비디아 응용 딥 러닝 연구소 부사장은 “간단한 스케치로 디자인을 브레인스토밍 하기가 매우 쉬워졌습니다. 이 기술로 스케치를 매우 사실적인 이미지로 만들어 낼 수 있죠”라고 말했습니다.

 

브라이언 카탄자로 부사장은 GauGAN에 적용된 기술을 개략적인 분할 지도 내에 세부사항을 채울 수 있는 “스마트 페인트브러시”에 비유했습니다. 장면 속 물체의 위치를 보여주는 정밀한 윤곽 표현 기술이죠. 

 

사용자들은 GauGAN으로 분할 지도를 그리고 장면을 조정해 모래, 하늘, 바다, 눈 등으로 영역별 라벨링을 할 수 있습니다.

 

수백만 개 이미지로 트레이닝된 이 딥 러닝 모델은 뛰어난 결과물로 장면을 연출해 냅니다. 연못을 그리고, 그 주변을 둘러싼 나무와 바위 등이 물에 비친 모습도 나타나죠. 영역 라벨을 “잔디”에서 “눈”으로 바꾸면 전체 이미지는 한 겨울로 변신합니다. 잎이 무성한 나무도 앙상한 가지만 남은 나무가 되죠.

 

브라이언 카탄자로 부사장은 “나무가 있는 곳, 해가 있는 곳, 하늘이 있는 곳 등을 표시하는 색칠하기 책과 같습니다. 그 작업이 끝나면 뉴럴 네트워크가 실제 이미지에서 학습한 내용을 바탕으로 모든 세부 사항과 질감, 반사, 그림자, 색상 등을 속속 채웁니다”라고 말했습니다.

 

 

GAN은 실제 세계에 대한 부족한 이해에도 불구하고 생성자(generator)와 감별자(discriminator)로 이뤄진 네트워크 쌍 구조 덕분에 설득력 있는 결과물을 만들어 낼 수 있습니다. 생성자가 이미지를 만들어 감별자에게 제시하면, 실제 이미지로 트레이닝된 감별자는 합성 이미지의 사실감을 향상시키는 방법에 대한 픽셀별 피드백으로 생성자를 지도합니다.

실제 이미지에 대한 트레이닝을 거친 감별자는 실제로 연못이 어떻게 생겼는지 알며, 호수 표면에는 사물이 반사돼 표현된다는 점도 압니다. 생성자는 감별자로부터 설득력 있는 모방을 만들어 내는 법을 배우죠. 

 

또한 사용자는 이 도구를 활용해 생성된 이미지를 특정 화가의 화풍으로 조정하거나 낮 시간 장면을 밤 시간 장면으로 변경하는 스타일 필터를 추가할 수도 있습니다. 

 

브라이언 카탄자로 부사장은 “GauGAN은 다른 이미지에서 가져온 여러 부분을 그저 조합하거나 잘라 붙이기만 하는 단순한 기술이 아닙니다. 오히려 화가가 그림을 그리는 방법과 매우 흡사하게 새로운 이미지를 만들어내는 것이라고 할 수 있죠” 라고 설명했습니다. 

GauGAN 앱은 육지, 바다, 하늘 등과 같은 자연 요소에 집중하는 한편, 기저에 있는 뉴럴 네트워크는 건물, 도로, 사람 등과 같은 다른 풍경 요소를 채워 넣는 역할을 합니다.

 

GauGAN 연구 보고서는 오는 6월에 열리는 컴퓨터 비전 · 패턴 인식(CVPR) 컨퍼런스에서 발표를 통해 인정을 받게 돼 있답니다. 5천개 이상의 제출 건 중 인정 받는 건 5%에 불과한데 말이죠. 

 

지난 GPU 기술 컨퍼런스에서 타이탄 RTX GPU로 실행되는 대화형 데모를 활용해 GauGAN을 직접 체험할 수 있는 기회가 제공된 바 있습니다.

주요 콘텐츠

사이트 탐색

  • 연구
  • API
  • 채팅GPT
  • 안전
  • 회사

찾다

탐색 빠른 링크

  • 로그인
  • 시작하다

GPT-4는 OpenAI의 가장 진보된 시스템으로 보다 안전하고 유용한 응답을 생성합니다.

빠른 링크

  • ChatGPT Plus를 사용해 보세요
  • GPT-4 연구 보기

GPT-4는 폭넓은 일반 지식과 문제 해결 능력 덕분에 어려운 문제를 더 정확하게 해결할 수 있습니다.

  • 창의성
  • 시각적 입력
  • 더 긴 컨텍스트

 

GPT-4는 그 어느 때보다 창의적이고 협력적입니다. 노래 작곡, 각본 작성 또는 사용자의 작문 스타일 학습과 같은 창의적이고 기술적인 작문 작업을 사용자와 함께 생성, 편집 및 반복할 수 있습니다.

입력

각 단어가 어떤 문자도 반복되지 않고 A부터 Z까지 알파벳의 다음 문자로 시작되어야 하는 문장으로 신데렐라의 줄거리를 설명하세요.

산출

 

A beautiful Cinderella, dwelling eagerly, finally gains happiness; inspiring jealous kin, love magically nurtures opulent prince; quietly rescues, slipper triumphs, uniting very wondrously, xenial youth zealously.

 

GPT-4는 고급 추론 기능에서 ChatGPT를 능가합니다.

 

채팅GPT

입력

Andrew는 오전 11시부터 오후 3시까지 무료이고, Joanne은 정오부터 오후 2시까지, 그리고 오후 3시 30분부터 오후 5시까지 무료입니다. Hannah는 정오에 30분 동안 통화 가능하며 그 이후에는 오후 4시부터 6시까지 통화 가능합니다. Andrew, Hannah, Joanne의 30분 회의 시작 시간 옵션은 무엇입니까?

 

산출

 

Here is a list of their availability: - Andrew: 11 am to 3 pm - Joanne: noon to 2 pm, and 3:30 pm to 5 pm - Hannah: noon to 12:30 pm, and 4 pm to 6 pm Based on their availability, there is a 30-minute window where all three of them are available, which is from 4 pm to 4:30 pm. So, the meeting can be scheduled at 4 pm.

 

GPT-4

입력

Andrew는 오전 11시부터 오후 3시까지 무료이고, Joanne은 정오부터 오후 2시까지, 그리고 오후 3시 30분부터 오후 5시까지 무료입니다. Hannah는 정오에 30분 동안 통화 가능하며 그 이후에는 오후 4시부터 6시까지 통화 가능합니다. Andrew, Hannah, Joanne의 30분 회의 시작 시간 옵션은 무엇입니까?

 

산출

 

Andrew: 11 am - 3 pm Joanne: 12 pm - 2 pm, 3:30 pm - 5 pm Hannah: 12 pm - 12:30 pm, 4 pm - 6 pm Common availability for a 30-minute meeting: 12 pm - 12:30 pm

 

GPT-4는 응시자 사이에서 더 높은 대략적인 백분위수를 기록하여 ChatGPT보다 성능이 뛰어납니다.

 

통일 변호사 시험

10일

채팅GPT

90번째

GPT-4

 

생물학 올림피아드

31일

채팅GPT

99번째

GPT-4(비전 포함)

GPT, GPT-2 및 GPT-3의 연구 경로에 따라 우리의 딥 러닝 접근 방식은 더 많은 데이터와 더 많은 계산을 활용하여 점점 더 정교하고 유능한 언어 모델을 만듭니다.

우리는 GPT-4를 더욱 안전하고 효율적으로 만드는 데 6개월을 보냈습니다. GPT-4는 내부 평가에서 GPT-3.5에 비해 허용되지 않는 콘텐츠에 대한 요청에 응답할 가능성이 82% 낮고 사실적인 응답을 생성할 가능성이 40% 더 높습니다.

안전 및 정렬

인간 피드백을 사용한 교육GPT-4의 동작을 개선하기 위해 ChatGPT 사용자가 제출한 피드백을 포함하여 더 많은 인간 피드백을 통합했습니다. 또한 AI 안전 및 보안을 포함한 영역에서 초기 피드백을 위해 50명이 넘는 전문가와 협력했습니다.실제 사용을 통한 지속적인 개선우리는 이전 모델의 실제 사용에서 얻은 교훈을 GPT-4의 안전 연구 및 모니터링 시스템에 적용했습니다. ChatGPT와 마찬가지로 우리는 더 많은 사람들이 사용함에 따라 정기적으로 GPT-4를 업데이트하고 개선할 것입니다.

GPT-4 지원 안전 연구GPT-4의 고급 추론 및 지시 따르기 기능은 우리의 안전 작업을 가속화했습니다. 우리는 GPT-4를 사용하여 모델 미세 조정을 위한 훈련 데이터를 생성하고 훈련, 평가, 모니터링 전반에 걸쳐 분류기를 반복했습니다.

 

GPT-4로 구축

우리는 GPT-4로 혁신적인 제품을 구축하는 조직과 협력해 왔습니다.

  • 듀오링고
  • GPT-4는 듀오링고에 대한 대화를 심화시킵니다.
  • 내 눈이 되어라
  • Be My Eyes는 GPT-4를 사용하여 시각적 접근성을 혁신합니다.

 

 

  • 줄무늬
  • Stripe은 GPT-4를 활용하여 사용자 경험을 간소화하고 사기를 방지합니다.

 

 
  • 모건스탠리
  • Morgan Stanley 자산 관리는 GPT-4를 배포하여 방대한 지식 기반을 구성합니다.

 

 
  • 칸아카데미
  • Khan Academy는 제한된 파일럿 프로그램에서 GPT-4의 잠재력을 탐구합니다.

 

 
  • 아이슬란드 정부
  • 아이슬란드가 언어를 보존하기 위해 GPT-4를 사용하는 방법

 

GPT-4에 대한 추가 정보

연구

GPT-4는 딥 러닝을 확장하려는 OpenAI 노력의 최신 이정표입니다.

GPT-4 연구 보기

 

하부 구조

GPT-4는 Microsoft Azure AI 슈퍼컴퓨터에서 교육을 받았습니다. Azure의 AI 최적화 인프라를 통해 전 세계 사용자에게 GPT-4를 제공할 수도 있습니다.

 

제한 사항

GPT-4에는 사회적 편견, 환각, 적대적 메시지 등 우리가 해결하기 위해 노력하고 있는 알려진 제한 사항이 많이 있습니다. 우리는 사회가 이러한 모델을 채택함에 따라 투명성, 사용자 교육 및 광범위한 AI 활용 능력을 장려하고 촉진합니다. 우리는 또한 모델을 형성하는 데 있어 사람들의 의견을 반영하는 방법을 확대하는 것을 목표로 합니다.

 

유효성

GPT-4는 ChatGPT Plus에서 사용할 수 있으며 개발자가 애플리케이션과 서비스를 구축하기 위한 API로 사용할 수 있습니다.

 

우리는 모든 사람에게 힘을 실어주는 기술을 개발하기 위해 노력하면서 사람들이 GPT-4를 어떻게 사용하는지 보게 되어 기쁩니다.

 

저는 텍스트 기반 AI 모델을 직접 그림을 그릴 수 있는 외에, 당신에게 지적인 이미지의 이미지를 선택하여 선택합니다.

 

지적인 건축가는 세련된 안경을 써서 영향력 있는 배우를 가지고 있습니다. 그의 옷차림은 불만족스러운 스타일을 선호하며, 종종 뚱뚱한 것을 싫어하는 상징입니다. 전문적인 자료와 책들이 가득한 곳에 서서 공부하고 소중한 지식을 쌓고 있습니다.

 

키보드 회의하는 사람들과 명쾌한 설명력으로 그는 학생들에게 깊은 곳을 주는 교수입니다. 그의 강의는 어려운 주제를 이해하기 쉽게 전달하며, 예외적으로도 주장을 추가로 제기합니다.

 

지적인 믿음은 열정과 믿음을 추구하지 않기 때문에 더욱 사랑을 받을 것입니다. 그의 지적인 토론과 행동 방식은 투자자에서 중요한 역할을 합니다. 지적인 선생님은 동료 학생들과 다른 사람들에게 지식과 혁신적인 것을 공유했습니다.

 

728x90
반응형
LIST