본문 바로가기

say와 AI 챗봇친구 만들기 보고서

[Auto-GPT] 스스로 새로운 업무를 수행하는 자동 AI Agent

728x90
반응형
SMALL

[Auto-GPT] 스스로 새로운 업무를 수행하는 자동 AI Agent

 

1. Auto-GPT 소개

Auto-GPT는 자연어로 된 목표를 받아 하위 작업으로 나누고 인터넷과 기타 도구를 자동으로 활용하여 달성하려는 AI 에이전트입니다.

이것은 OpenAI의 GPT-4 API를 기반으로 합니다. 개발자들은 Auto-GPT가 자신의 코드를 다시 작성하고 개선할 수 있다고 주장하고 있습니다.

Auto-GPT는 단기 및 장기 기억을 관리하며, 음성 출력을 위한 텍스트-음성 변환 기능도 포함하고 있습니다.

 

깃헙 링크: https://github.com/Significant-Gravitas/Auto-GPT

 

Auto-GPT는 GitHub에서 현재 가장 인기 있는 리포 중 하나입니다.

3/30에 공개가 되었는데, 작성일(4/17)을 기준으로 83k의 star를 받았습니다! pytorch가 65.6k인 것을 감안하면 정말 높은 수치이죠!

더 놀라운 점은 issue와 PR의 수 입니다. 현재 개선할 포인트와 아이디어가 넘쳐난다는 것과, contribute하고자 하는 사람들이 많은 코드 개선을 하고 있다는 것을 확인할 수 있기 때문이죠!

앞으로의 발전이 정말 무궁무진합니다!

 

하지만, GPT-4 모델의 환각(hallucinations) 문제들로부터 자유롭지는 못합니다.

Auto-GPT에서는 이러한 문제점을 해결하기 위해 AgentGPT를 만들어 사용자가 자신의 웹 브라우저에서 agent를 만들 수 있도록 했습니다.

즉, 하나의 미션을 달성하기 위해 하위 작업들을 만들어 수행하며, 웹을 크롤해서 새로운 정보를 얻는 등 다양한 하위 작업으로 문제를 보완합니다.

 

심지어, Auto-GPT는 작업을 완료하고, 이 결과를 기반으로 새로운 작업을 수행합니다. 여기서 왜 "Auto"인지를 알 수 있습니다.

즉, 하나의 미션을 주면, 그것으로부터 계획을 세워 하위 작업들을 만들고, 하위 작업들을 수행하여 문제를 해결합니다.

그런데, 이러한 과정 속에서, 혹은 그 이후로도 각 작업의 결과를 기반으로 새로운 작업을 수행합니다. 자원만 있다면, 무한히... 도 할 수 있겠죠.. 어떻게 들으면 무섭기도 합니다.

 

2. 주요 기능

🌐 Internet access for searches and information gathering

💾 Long-Term and Short-Term memory management

🧠 GPT-4 instances for text generation

🔗 Access to popular websites and platforms

🗃️ File storage and summarization with GPT-3.5

 

추상적으로 설명했던 부분을 좀 더 명확하게 정의된 기능으로 살펴봅시다. 공식 깃헙 레포에서 설명하고 있는 기능들이 위와 같습니다.

환각 문제를 해결하기 위해 새로운 정보를 검색하고 모으기 위한 인터넷 접속, 장기간/단기간 메모리 관리, 텍스트 생성을 위한 GPT-4, 파일 저장 및 요약 기능들이 있습니다.

 

많은 사람들이 데모를 하는 것들을 많이 찾아볼 수 있는데요, 기억나는 몇 가지 미션들을 정리해봤습니다.

  1. 연구/개발: 주어진 키워드를 기반으로 논문이나 글을 작성하는 데 사용할 수 있습니다. 특히 논문 요약하는 것은 매우 잘합니다.
  2. 주어진 내용에 대해서 코드 개발도 가능하며, 단순한 스니펫부터 전체 프로그램까지 생성이 가능합니다. 앱을 개발하는 것을 시도한 사람도 보았습니다.
  3. 디자인: 컬러 팔렛트와 요소들을 알려주고 디자인하라고 하면 로고, 상품 등 다양한 것을 디자인합니다.
  4. 웹사이트 제작: AutoGPT는 웹사이트 콘텐츠를 생성하고 레이아웃까지 디자인할 수 있습니다.
  5. 기사 작성: AutoGPT는 주어진 키워드 또는 문구를 기반으로 모든 주제에 대한 기사를 작성할 수 있습니다.
  6. 마케팅: 주어진 키워드를 기반으로 제품을 설명하거나, 홍보할 수 있는 카피를 만들거나, 광고를 위한 큰 프로그램을 기획할 수도 있습니다.
  7. 레시피: 레시피를 물어보면, 검색해서 찾아서 알아서 요약해서 줍니다. 좀 어려운, 생소한 레시피도 잘 찾아 정리주는 것 같았습니다.

Auto-GPT는 기존에 AI로 할 수 있는 일의 한계를 뛰어넘는 혁신적이고 야심찬 프로젝트입니다.

단순하게 질의응답을 하는 언어 모델, 다음 텍스트를 추정하는 언어 모델의 기능을 넘어- 다양한 가능성을 볼 수 있는 사례들이 Auto-GPT를 통해 보여지고 있습니다.

결국 모든 문제는 작은 문제들로 나눌 수 있으며, 우리 개발자들에게 친숙한 divide & conquar의 정신으로 해결해나갈 수 있지 않을까 합니다.

이러한 Auto-GPT의 잠재력은 무시무시하고, 앞으로 어떤 사례들을 더 만들어나갈지 기대가 됩니다. 여러분들도 한 번 써보시죠!

 

3. 데모

다양한 케이스들의 데모들이 있지만, 다음의 케이스에 대해서 간단히 살펴봅시다!

 

데모 영상 링크: https://user-images.githubusercontent.com/70048414/232352935-55c6bf7c-3958-406e-8610-0913475a0b05.mp4

Demo made by Blake Werlinger

 

Auto GPT에게 role을 부여하고, Goal을 설정해줍니다! 그리고 이것을 수행시키면...

 

Auto-GPT가 이 미션을 받고 생각을 합니다... 추론도 하구요, 그리고 계획을 세웁니다.

정말 놀랍지 않나요?

그리고 스스로 비평도 해서, 부족한 부분이 뭔지까지 생각합니다... 그리고 next action 까지......!!

정말 어마어마합니다...

 

최종적으로, 내용을 요약해서 파일을 쓰기까지 합니다.

단순히 대화형의 AI를 넘어선 느낌입니다.

전체적인 과정이 정말 자비스 같이 느껴지더라구요..!

여러분의 생각은 어떠신가요?

 

4. 한계점

Auto GPT는 GPT-4의 잠재력을 보여주기 위한 것이지만, 몇 가지 한계가 있습니다:

  1. 완성된 애플리케이션이나 제품이 아닌 실험에 불과합니다.
  2. 복잡한 실제 비즈니스 시나리오에서는 제대로 작동하지 않을 수 있습니다.
  3. 실행 비용이 상당히 많이 들기 때문에 OpenAI로 API 키 한도를 설정하고 모니터링해야합니다.

 

PS

*사용하기 위해서는 이런저런 API Key 셋팅, 연결을 위한 셋팅(host, port password 등) 등 다양한 것들을 수행해야하지만, 어려운 일이 있지는 않습니다.

*재미있는 이야기로는 Auto-GPT는 인류를 파괴하는 목표로 만들어진 ChaosGPT를 생성하기도 했지만, 즉시 성공하지는 못했다고 합니다.

728x90
반응형
LIST