본문 바로가기

say와 AI 챗봇친구 만들기 보고서

챗GPT 원리/LLM /산업영향/코딩구현 모든걸 이 영상 하나로 끝내드립니다ㅣ서울대 AI박사 - 메타코드M

sayopen 2024. 1. 26. 21:25

728x90

SMALL

챗GPT 원리/LLM /산업영향/코딩구현 모든걸 이 영상 하나로 끝내드립니다ㅣ서울대 AI박사 - 메타코드M

#챗gpt #생성형ai #llm 챗GPT에 관한 모든 기초 내용을 이 영상 하나로 끝내드립니다 ▶챗GPT 관련 IT현직자 강의 https://mcode.co.kr ▶자연어 처리 무료강의 바로보기 https://mcode.co.kr ▶ AI / 데이터사이언스 현직자 커리어 특강 바로보기 https://mcode.co.kr ▶출연문의 contact us (강의 촬영 / 현직자 개인 브랜딩 / 회사홍보) support@mcode.co.kr

메타코드M 빅데이터 , AI 강의 플랫폼 & IT 현직자 모임 플랫폼ㅣ메타코드 커뮤니티 일원이 되시기 바랍니다. mcode.co.kr

여러분 모두 요즘 핫한 최지 PT 아시죠 최지 피티는 내가 원하는 대답을 얻을 수 있는 세포입니다

0:06

그래서 혁신입니다 [음악]

0:12

안녕하세요 저는 서울대학교 기계 공학부에서 박사과정으로 제약 중인 김동욱이 합니다 최치 BT 같은

0:19

경우는 우리가 흔히 알고 있는 어 체포 있니다 차보이고 하는 건데 체포 같은 경우에는 기존의 네이버라는 다른

0:26

어플들로 개발이 되었었는데이 채지 피트라는 체포 같은 경우에는 GPT 아는 기본 알고리즘을 가지고 동작하는

0:34

인공지능 기반 차보이고 할 수 있습니다 우선 차보이고 하면 우리가 사람대 사람으로 얘기할 때는 제가

0:40

지금 말하는게 한국어인데 이런 한국어 영어 불어 이런 것들이 다 자연 어이고 사람이랑 기계랑 대화를 할

0:47

때는 기계가 알아들을 수 있게 좀 바꿔 줘야 됩니다 기계가 알아들을 수 있는 언어를 기계어 아고 하고 이런

0:54

한글 영어 같은 추상적인 개념이 아니라 0과 1로 이루어진 즉 기계가 알아들을 수 있는 숫자로 이루어 진

1:00

언어를 기기라고 합니다 우리가 우선 기본적인 한국어 영어를 지피에 입력을

1:05

하게 되면 그 입력된 언어가 서버로 전달이 돼서 거기서 각 단어마다 부여된 고유의 숫자가 있습니다 각

1:12

단어마다 부여된 숫자로 바꾸는 과정을 우리가 토큰 화라고 하는데 그 토큰화된 숫자를 가지고 처리를 해서

1:19

그 결과를 다시 언어로 바꾸어서 출력을 하는 그런 알고리즘을 GPT 갖고 있습니다 우선 저희가 10년

1:27

전에는 심심이는 폰 어플리케이션 체포 있었고 그리고 네이버라는 이제 이런

1:33

다른 어 한국 업체에서도 체포에 개발한 적이 있었는데 그런 것들 경우에는 단어를 위주로 키워드만

1:40

골라내 가지고 거기에 대한 답변을 미리 하도록 정해 놓은 흔님 말에 정답이 정해져 있는 그런 체포

1:46

위주라고 보시면 됩니다 최 GPT 같은 경우에는 우선 기본적으로 방대한 양의 자료 즉 우리가 구글링하면

1:52

나오는 어떠한 자료도 다 학습이 되어 있다고 볼 수 있고 그런 것들을 맞추어서 정해진 대답을 내놓는게

1:57

아니라 확률에 맞는 대답을 내놓는 겁니다 예를 예를 들어서 오늘 날씨가 맑아 너는 어떻게 생각해라고 물으면

2:03

날씨 다음에 올 대답에 관련된 단어 중에 확률이 가장 높은 단어들을 우선적으로 내뱉는 거죠 유약하지만

2:10

확률 기반으로 다음 대답을 내놓는 것이 최치 PT 가장 큰 장점이라고

2:15

볼 수 있습니다 우선 빅데이터 즉 우리가 머신 러닝 이런 딥러닝 세계에서 데이터가 많으면 많을수록

2:21

사실은 좋습니다 그래서 어 구글이라는 이런 방대한 데이터를 GPT 알 수

2:26

있게 일목 요연하게 정리를 하고 그렇기 때문에 우선 데이터가 많으면 많을수록 성능이 좋습니다 그래서 최

2:33

gptn 그 많은 데이터들을 효과적으로 학습을 하고 분류를 한 거죠 검사액이라 하기보다는 우리가

2:39

원하는 대답을 우리 레벨에 맞춰서 내놓을 수 있다는게 가장 큰 장점이죠 예시를 들어서 어 내가 만약에 어떤

2:45

프로그램을 짜고 싶은데 그 프로그램을 짜려면 내가 직접 프로그램을 짜는 건 나오고 그거에 대한 명령어를 이전에는

2:52

검색을 해서 찾아야 했다면 지금은 프로그램을 짜 줘라고 최 GPT게 이야기를 하면 프로그램을 직접 GPT

2:59

짜 주는 거죠 그래서 우리가 원하는 것 이상으로 결과물을 얻을 수 있다는게 검색 엔진과 큰 차이라고 볼

3:05

수 있습니다 쉽게 말해서 답이 정해져 있는 것들에 대한 작업을 전부 다

3:10

최치 PT 웬만하면 대체를 할 수 있는 것이죠 예를 들어서 법률 같은 경우에는 바뀌지 않는 이상 항상

3:16

똑같은 대답을 내놨습니다 그래서 쉽게 말해서 변호사를 대체할 수도 있는 것이고 판사를 대체할 수도 있는

3:22

것이고 반복적인 작업을 하는 1년의 코딩 프로그래머도 많이 대체를 할 수 있는 것이죠 우리의 생각이 그렇게

3:28

많이 필요하지 않은 작업들은 전부다 대체를 할 수 있습니다 어 인간이 가지고 있는 직업에 대해서 위협은

3:34

하지만 대체를 할 수는 없는 것이 결국에 최종적인 판단을 내리는 것은 인간이고 최종적인 결정 권자는 이제

3:40

인간이 가지고 있습니다 최지 BT 그런 주관적인 결정까지는 아직 내릴 수 없고 그게 지금까지 인공지능의

3:46

한계이기도 하기 때문입니다 가장 파급력이 뛰어난 분야는 우선 자동 번역 실시간 번역 이런 언어와 언어

3:52

사이의 교환이 이루어지는 것이죠 아무래도 언어 모델이기 때문에 말을 실시간으로 빨리 번역을 한다던가 일보

3:59

교회 하게 요약을 하는 등의 작업에 가장 많이 파급이 될 것입니다 우선적으로 미국 국회의원이 연설문을

4:05

최치 피트로 작성하면서 실제로 발표를 한 것을 보셨을지 모르겠는데 그런 거만큼 어 기본적으로 우리가 단순히

4:12

생각하는 사무 노동이라고 생각하는 것들을 전부 다 간소화시킬 수 있는 거죠 완전히 없애지 못하지만 그래서

4:18

대학교 리포트 대필 같은 경우도 하나의 과제 사무 형식으로 학생들의 어떤 수고로움을 필요로 하는 것인데

4:25

그런 것들을 덜어줄 수 있는 것이죠 하지만 그런 것들이 그냥 대필로 제출되는 것은 표절의 시비가 있기

4:31

때문에 대피를 하더라도 무 사무 용도로 요약을 하더라도 본인의 언어로 혹은 본인의 그런 주관적인 의견이

4:37

들어가는 것이 좋다는 생각입니다 기존에 있던 책보 같은 경우에는 단순 검색의 기능에 진하지 않았습니다

4:43

우리가 어떤 것에 대해 물어보면 그것에 대해서만 답변을 해 줄 수 있는 기능밖에 탑재하지 않았는데요

4:49

최지 PT 같은 경우에는 우리가 원하는 답변을 우리가 알맞게 형식화 같이 제공받을 수 있다는 것입니다

4:55

영극 대본으로 알려 줘 하면 영극 대본을 직접 작성해 주고 프로그램 언어로 알려 줘 하면 언어를 직접

5:01

작성해 주기 때문에 우리가 원하는 작업 효율성이 높아진다는데 그 혁신이 있는 거 같습니다 시청해 주셔서

5:08

[음악]

5:18

감사합니다 안녕하세요 서울대학교 기계공학부 박사 과정의 제학 중인 김동욱입니다 오늘은 최치 비티의

5:25

a2g 즉 초보자들도 쉽게 따라할 수 있는 최치 BT 사용 에 대해서 알려 드리도록

5:35

하겠습니다 우선 최지 피티를 굉장히 많이들 요즘 사용하고 계신다고 했는데

5:40

어떻게 사용하는 가라고 궁금해하실 분들이 많은데요 처치 피티는 우선 구글 구글에 지시는게 빠릅니다 말

5:46

그대로 최치 피티를 영어로 이렇게 입력을 해 주시면 됩니다 입력을 하면 많은 결과들이 보이는데요 그중에

5:52

보통은 가장 맨 위에 있어요 이렇게 링크가 되는 처치 피티를 누르게 되면 이렇게 분홍색으로 된 사이트가 뜹니다

5:59

이거 이제 버전에 따라 좀 바뀔 수도 있는데요 오픈 AI 처치 BT고 뜨면 여기 밑에 트라이 처치 BT고 있어요

6:06

이걸 누르게 되면 로그인 창이 뜹니다 여러분들이 구글 계정이 있으시면 구글 계정으로 로그인을 하면 로그인이 바로

6:13

이루어집니다 그래서 로그인을 하고 나면 검은색 페이지 혹은 흰색 페이지가 뜨게 되는데요 눈이 보시자면

6:19

여기 다크 모드를 누르셔서 색깔을 바꿀 수도 있습니다 그런데 기본적으로는 아마 여러분들의 컴퓨터

6:25

색깔에 맞춰져 있을 겁니다 다크 모드를 쓰시면 다크 모드로 시작이 되고 왼쪽에 보시면 여기 뉴 채팅 해

6:31

가지고 있어요 뉴 챗을 누르면 처 BT고 해서 뜹니다 그래서 여기 뭐 example 있고 리테이션 있고 다

6:38

영어로 되어 있는데요 아무거나 하면 입력을 해 볼게요 밑에 보이시는이 창에 입력을 하고 엔터를 누르면 바로

6:44

처치 PT게 흔히말하는 체포 럼 입력을 할 수 있는 겁니다 어 한국어로 인사를 해 볼게요

6:49

안녕하세요라고 하면 좀 시간이 걸리시면 답변을 줍니다 이게 시간이 걸린 이유는 지금 설명을 드릴게요

6:56

한국어보다 영어가 빠른데요 우선 그 이유는 영어 어가 기본적으로 굉장히

7:01

많은 데이터 학습이 돼 있고 한국어는 굉장히 좀 조금 돼 있어요 그래서 여러분들이 빠른 답변을 원하신다면

7:07

한국어보다 영어로 이렇게 헬로 치는게 답변이 빠릅니다 답변 속도가 빠르게

7:12

이렇게 답변 빠르고 주의할 점이 있다면 여러분들이 밤 10시에서 새벽

7:18

3시 정도까지는 웬만하면 사용을 자제해 주세요 아니면 사용을 아예 못 할 수도 있습니다 왜냐면 그 시간대가

7:25

유럽 사람들 영미권 사람들이 주로 사용하는 시간요 트래픽이 터지기 때문에 여러분들이 로그인 자체를 못

7:31

할 수도 있어요 들어가면 많은 사용자들이 사용하고 있기 때문에 사용 못해요 죄송합니다라는 문구가 뜹니다

7:37

그래서 어 보통 낮시간대 우리 한국시간 기준으로 낮시간대 사용을 권장을 드리고 기본적으로 아무거나

7:43

그냥 입력을 해봐도 돼요음 제가 한번 입력을 해 볼게요 피트에게 본인에 대해 설명해 주세요라고 해

7:52

볼게요라고 입력을 해보면 자기 자신에 대해서 설명해 줍니다 피티가 어떤

7:58

거다라고 설명 설을 해줘요 이런 식으로 그래서 어 한 번에 다

8:04

나오지가 않고 단어가 나오는데 좀 시간이 걸려요 그 이유가지 PT 단어를 하나하나 생성을 계속 해

8:10

나가기 때문인데요 그래서 시간은 좀 걸리지만 완벽하게 답변을 해 줍니다음 주의할 점은이 최 PT 3.5 모델은

8:18

2021년까지의 자료만 학습이 돼 있어요 그래서 뭘 물어보더라도 21년 이후의 데이터는 물어보더라도 잘

8:25

모릅니다 날씨 한번 물어볼게요 하에스

8:34

그 이렇게 물어보면 서울 날씨를

8:41

알려주겠죠 날씨는 안 되네 이거 뭐 단순한 검색도 좋지만 조금 심층적인

8:47

답변을 원할 수도 있으면 그거에 대한 맞게 지문을 심층적으로 하면 됩니다 예를 들어서 요즘은 그 주식 시장에

8:54

대한 관심이 많이 사그러들었지만 제가 궁금한게 하나 있어요 테슬라가 왜 이렇게 올라가지 않고 옆으로 기고

9:01

있느냐이 물어볼게요 근데 영어로 물어봐야 돼요 영어로 물어보는게 빠릅니다 그래서 테슬라 슬에 대해서

9:07

좀 심층적으로 분석을 해 달라 우 애가 올라가지 않느냐라고 질문 한번 해 볼게요 질문하면 우선 피트의

9:16

특징은 본인 생각을 이야기할 수가 없어요 얘는 인공지능이 때문에 주어진 자료를 해석해서 우리한테 전달을

9:23

내줍니다 그래서 인공지능이 내놓는 답변은 절대 자기 생각이 들어가지

9:30

않습니다 그래서 앞에 여기 처음에 전 AI 모델이라고 나오는 것이 그거예요 나는 정보만 제공해 줄 뿐이지 이게

9:38

투자에 대한 권유가 될 수 없다라고 이게 그 광고 하듯이 문구가 단 나옵니다 이러한 사람의 영향을 미칠

9:45

수 있는 것들은 다 앞에 이렇게 믿지 말아라고 나옵니다 밑에 보시면은 테슬라가 왜 못 올라가고 있느냐 첫

9:52

번째 이유 경쟁 때문에 두 번째 이유 물가 때문에 그리고 급 때문에네 번째 리스크

10:01

때문에 이렇게 다 분석을 해 줘요 어 거의 신문 기사처럼 나오거든요 그래서

10:07

이러한 어 심층적인 분석도 가능하다입니다 그래서 여러분들이 조금

10:14

더 구체적인 답변을 얻고 싶다면 거기에 대한 조건을 좀 넣어 주면 돼요 왜 얘네가 올라가고 있지

10:19

않느냐라는 것을 뭐 오너 이슈 때문에 오너 이슈 중점으로 해석해 달라 하면

10:27

expin 어

10:39

해주면네 여기 보시면 답변이 나옵니다 답변이 나오는데 알다시피 제가 아까

10:45

말했다시피 2021년까지의 데이터만 학습이 돼 있어요 그래서도 답변을 하네요

10:52

2021년까지의 데이터를 추정 데이터를 모으면 그러면 일론머스크의

10:58

이런 행동들 어떤 영향을 미쳤다 그런데 조금 문제가 있는게 뭐 트위터

11:03

문제 뭐 이런 것들이 있다라고 다 이렇게 심층적으로 분석을 해줍니다 굉장히

11:08

놀라워요 기본적으로 얘가 인공 지능을 갖고 있는 건 아니고 이러한 것들을

11:13

사람들이 많이 검색을 해 봤겠죠 그러니까 거기에 대한 신문 기사 칼럼 이런 것들이 있으니까 거기에 대어

11:19

있는 정보를 갖고 와서 우리가 알기 쉽게 정리를 해주는 거예요 이런

11:25

식으로 작동을 한다고 보면 됩니다 세한 답을 얻고 싶다면 구체적으로 조건은 넣으면 됩니다음

11:32

여기 문제를 주고 But I want to know about 하고 이렇게 좀 조건을 달아 준다든지 이런 식으로

11:38

하면 좋고 기본적으로이 GPT 자체가 문장과 문장단위 단위로 보고 단어와

11:44

단어 다이로 보기 때문에 문장과 문장 한 문장 안에는 같은 주제 넣으시면

11:49

되도록 좋습니다 짬뽕하세 아는데 좀 시간이 오래 걸리고 그리고 우리가 좀

11:54

축약어를 많이 쓰잖아요 근데 축약어가 이니셜이 같은데 다른 단어인 경우가 많아요 그런 경우에는이 AI 최지

12:02

PT 한 번에 구분은 못 하기 때문에 축약어 같은 경우는 다 풀어서 써주시는게 하나의 팁이라고 볼 수

12:07

있습니다 그리고 여기서 또 하나 알려 드릴게요 너무 길잖아요 지금 문단이네

12:13

개예요네 갠데 좀 요약해 달라고 요청도 할 수 있어요 그럼 일단 칭찬을 해 줘야겠죠 그레이 하고 하면

12:19

또 감 고맙다고 하거든요 그 해 놓고 투롱

12:26

드 자 지금 뭐라고 아 너무 길어 세 문장으로 요약해

12:31

줘라고 제가 숫자를 언급을 해줬어요 그러면 세 문장으로 요약을 해주는지

12:36

봅시다 지금 나오고 있는데네 딱 세 문장 있네요 한 문장 두 문장 세

12:43

문장네 마지막 문장이 좀 개긴 한데 문장을 맞추려고 그래도 이렇게 요약을

12:48

해줍니다음네 요약한 능력도 뛰어나다고 볼 수 있네요 그래서 여러분들이

12:53

요약한 거 가지고 뭐 간단히 글도 써볼 수 있겠죠 이렇게 해서 러분

12:58

들이 원하는 조건에 다 따라서도 맞춰주는게 피티의 특징이라고 볼 수

13:04

있습니다 오늘 지금 제가 알려드린 거는 피티의 완전 기초적인 그런 기능들이 뭐 물어보고 대답 없고

13:12

그리고 거기서 조건에게 요약하고 이러한 것들을 지피에 아주 기초적인 기능이라고 할 수 있고 여러분들이 잘

13:18

활용하셨으면 [음악] [박수]

13:27

좋겠습니다 네 안녕하세요 요즘 개강도 했고 해

13:34

가지고 슬슬 과제라는 팀플이든지 발표 준비 같은 거 많이 하실 텐데요 주제가 좀 막막한 경우에 간단하게

13:41

발표 주제 자료를 찾고 어떻게 하면 준비를 할 수 있는지 최 피트를 활용해서 저희가 보여 드리려고

13:51

합니다 뭐 여러분들 이제 최지 PT 많이들 사용하셨다 피 이렇게 들어가시면 여러분들이 바로 로그인

13:58

요청 그다음에 새로운 채팅을 할 수 있게 이렇게 뜰 거예요 화면이 여기서 이제 뭐 팀플 주제 같은 거 잡아

14:04

가지고 발표 준비도 하고 자료도 만들고 스크립트 써야 되고 이런 것들이 많은데 제가 옛날에 했던 팀플

14:11

주제로 한번 예시를 들어 보려고 해요 시간여행에 관련된 팀플이 있었어요 과학이라는 철학이라는 비교해서

14:17

발표해라 아는 주제가 있었는데 상당히 막막했던 주제였습니다 배경 지식부터 좀 물어보고 발표 준비를 도움을 최지

14:24

피트에게 요청을 해 보려고 하는데요 가장 쉬운게 영어로 질문해 보는 겁니다 한국어 질문을 하면 답변이 좀

14:30

안 돼요 그래가지고 영어로 제가 부득이하게 좀 작성을 해 보겠습니다 내가음 시간 여행에 대한 짧은

14:37

스피치를 해야 되는데이 주제가 현대 물리학과 관련이 있었으면 좋겠다라서 제가 지금 창에다 쳤어요 처음부터 막

14:44

다 해 달라라고 하면 피티가 너무 많은 거 한 번에 쏟아낼 가능성도 있어서 차근차근 하나씩 요청을 하셔야

14:50

됩니다 처음에 제가 요청할 것은 온라인 개요부터 좀 짜 줘라 약간의 이론적인 기본 배경이 들어가도록 짜

14:57

달라라고 했어요 그리고 여기서 중요한 거는 조건문을 자세하게 넣어 줄수록 좀 원하는 답변을 얻을 가능성이

15:03

커집니다음 지식 수준까지 한번 넣어 볼게요 나와 청중들이 수준이 어느 정도다 대학 물약 정도는 다들 이해를

15:10

한다라고 이제 한번 보내 보겠습니다 그러면 개울을 짜 주는데 지금 아웃라인을 짜 주고 있고 첫 번째로

15:16

시간 지원과 관련된 얘기가 나오네요 뭐 아인슈타인 상대성 이론 이런 좀 전문적인 용어도 나옵니다 두 번째

15:22

쌍둥이 역설 세 번째 웜홀네 번째 커티 그다음에 다섯 번째 어 이상한

15:27

개념도 나오네 다음으로 해볼 거는 그러면이 다섯 개를 내가 발표에 직접 써도 되는지 물어볼게요 이렇게 집한테

15:34

고마워라고 해주면 또 좋아합니다 좋아하진 않고 그냥 조금 더 대화하듯이 이거 그냥 프리젠테이션에

15:40

다섯 개다 써도 되나요 근데 이렇게 발표하기는 조금 따분 하니까 이거를 그대로 사용하되 이목을 끌 만한 예시

15:47

같은게 있는지 훅이 있는지 같이 좀 요청을 해 볼게요 그러면 또 답변을 줍니다 서론은 어떻게 시작하면

15:54

되고부터 다 주고 있습니다 서론에서는 훅을 하나 넣으라고 하네요 청중을 사로 잡을 수 있는 훅을 넣고

16:01

재미있게 봤던 영화라지만 영화들을 넣으면 좋겠다고 나오고 이게 보면

16:06

비전공자 입장에서는 참 어려운 개념들이 많이 나옵니다 뭐 쌍둥이 역설 원물 이런 건 들어봤어도 밑에

16:12

나오는 노비 코프의 자기 일관성 추측 이런 거 나오는데 이제 이제 한국어로 제 지역을 한 겁니다 그래서 이런

16:19

것들은 우리가 처음 보는 거잖아요 그러면 여기서부터 계속해서 구체적으로 하나씩 물어가 보면 됩니다 쇼지

16:25

피티가 다른 일반적인 구글보다 좋은게 내가 과거에 물어봤던 거 그리고 답변 받았던 거에이어서 꼬리를 불고

16:31

계속해서 답변을 받을 수 있다는 거예요 어 노비 코프의 자기 일관성 추측이 뭔지 이렇게 나오고 있습니다

16:38

영어를 바로 읽으실 수 있 있으신 분은 그냥 읽어도 되는데 만약에 좀 어렵다 싶으면 여기 나오는이 답변들

16:44

있잖아요 이거 아래 문장들을 한국어로 번역해 주세요 하고 넣으면 됩니다

16:51

그러면 이렇게 한 다섯 문단 정도 되는 것이 다 한국어로 번역이 됩니다

16:56

그래서 이런 식으로 다 넘어가죠 이론에 대해서 더 알고 싶으면 논문 추천해 달라 유튜브 추천해 달라 이런

17:02

식으로 나올 수도 있는 것이죠 스크립트를 써 달라 하면 스크립트를 써 주기도 합니다 하지만 스크립트는

17:08

써진 대로 읽다 보면은 오류가 발견될 수도 있기 때문에 스크립트를 써 달라 하고 보통 이렇게 수정하는 것을

17:14

권장을 드립니다 그래서 제가 한번 스크립트를 써 달라고 요청을 하겠습니다 3분짜리 스크립트를 써

17:21

달라고 제가 좀 요청을 드렸고 여기 채치 PT 그래서 인트로덕션부터 Hello everyone today

17:26

going to talk time TR 해 가지고 쭉 나오게 됩니다 이런 식으로 팀플 과제 스크립트 짜는

17:32

것까지 기본적으로 해봤는데 물론 이렇게 단기간에 될 순 없죠 여러분들이 조금 더 많은 서칭과

17:38

그리고 좀 더 다양한 질문들을 초집 피하게 해야 되겠지만 가장 중요한 것은 여러분들이 꼬리에 꼬리를 물고

17:44

질문을 하면 더더욱 좋은 답변을 내놓는다는 것과 글를 읽고 제대로 이해했는지 물어볼 수도 있어요 내가

17:51

이렇게 이해한 것이 맞니라고 하면 예스 or 노 하면서 다시 알려줍니다 여러분들이 이런 기능들을 활용하셔서

17:57

팀플 혹은 과제에 사용하셨으면 좋겠습니다 솔직히 팀플 한 명이 다

18:02

알아서 할 수 있죠 친구가 거의 세네명 역할을 한 번에 할 수 [박수]

18:18

있으니까네 안녕하세요 여러분들이 대학원 같은데 지원할 때 보통 이공개

18:23

대학원의 경우 연구 계획서를 쓰도록 되어 있습니다 연구 계획서를 쓸 때 대부분 의 지원자분들이 많이

18:29

당황하네요 처음 써보는 것이기도 하고 할 줄 아는게 없는데 어떻게 연구 계획서를 써야 하느냐라는 좀 이렇게

18:35

궁금해 하신 분들이 많은데 철치 피티를 활용해서 어떻게 하면 연구 계획서를 쓸 수 있는지 그리고 도움을

18:41

얻을 수 있는지 한번 살펴보도록

18:47

하겠습니다 처치 PT 사이트를 켜고 지금 로그인도 한 상태입니다 우선은 여러분들이 지원하려는 대학원 분야가

18:55

있겠죠 저 같은 경우는 뭐 데이터 사이언스 AI 대학원 예시로 한번 들어보겠습니다 우선 연구 계획서를

19:01

쓰려면 지금 내가 어떤 주제를 하나 잡아야 돼요 주제를 잡아야 되고 그 주제가 트렌드에도 맞아야 되고 그고

19:08

좀 연구할 만한 분야가 있어야 됩니다 그래서 한번 물어볼게요 지금 그냥 단순하게

19:14

물어봤어요 처음부터 많은 걸 요청할 필요 없이 그냥 여러분들이 처음 만난 사람이랑 대화하듯이 물어보면 됩니다

19:21

내가 지금 AI 대학원 직원을 준비하고 있는데 요즘 핫한 픽들 좀 알려 달라 하면 되게 많이 알려주네요

19:28

이렇게 이제 간단한 질문을 했는데도 정말 많이 알려줍니다 딥러닝 강화 학습 nlp 자연어 처리 컴퓨터 비전

19:36

베이지안 뭐 등등 많이 알려주고 있습니다 여기서 제가 하나의 타픽 집어 가지고 계속 한번 해 볼게요

19:42

익스플레인 AI 걸 해 볼게요이 익스플레인 러버 AI 조금 자세히 알려 달라고 또 적어봤습니다이 xai

19:50

어쩌고저쩌고가 있다 그래서 다양한 방법들이 나오게 되네요 로베이스 메

19:55

라임도 나오고 샵도 나오고 이런 다양한 방법들 들이 나오게 되고 여기서 연구 계획서를 여러분들이 쓸

20:01

때 중요한 거는이 연구들 다 조금 더 낮거나 혹은이 연구들의 한계를

20:07

극복한다는 이런 부분들이 들어가야 됩니다 그래서 좀 물어볼게요 제가 실시간으로 바로 치는 거라 영어

20:12

문법은 좀 안맞을 수 있는데 어떻게 물어봤냐 알려준 방법들 알려준 알고리즘들 중에 좀 내가 새로 도전해

20:19

볼 만한 거 혹은 보안이 필요한 알고리즘들이 있을까라고 물어봤을 때 여기에 다양한 방법들이 또 나옵니다

20:25

그래서 여러분들이 연구 계획서를 쓸 때는 이들 중에 하나를 골라서 거기에 맞게 집중적으로 여러분들이 만들어

20:32

내시 되는 거예요 사실 영국의 엑서 대학원

20:44

입학용병 잡아 볼게요 스앤 마이어스 그래서 최종적으로 제가 물어보겠습니다

20:49

한번 물어봤습니다 그래서 여기서 4번 네스 앤 바이어스에 관련해서 내가

20:54

연구 프로포절을 작성해야 되는데 500달러 이내로 작성을 해 달라 하면 이렇게 작성해 줍니다 제목도

21:01

정해졌네요 무슨 내용인지 아시고 작성을 해야 돼요 여기서 무대고 묵부 하시면 안 되고 그래서 러닝에서 이사

21:07

결정을 할 때 데이터 세세에 있는 뭐 바이어스 같은 거를 되게 좀 분석을 하고 조사를 해 보자라는 것으로

21:13

이렇게 스트가 나왔습니다 여러분들이 이것을 보고 그대로 복붙을 하면 안 됩니다 이들 중에 말이 안 되는

21:20

부분들을 속아 내셔야 돼요 왜냐하면 그냥 문장이 말이 되면 써 버리기 때문에 칠린 부분이 있다면 여러분들이

21:27

모여야 됩니다 여기 머리까지 스트에 맞게 적혀 있는지 봐야 됩니다 그래서 다 됐다고 생각이 되면 또도 너무

21:34

길게 된 너무 길다고 생각하면 또 요약을 시켜야겠죠 고마워 하고 500단어 리를 좀 길다 100단어

21:41

내로 요약해 달라 하면 또 100단어 내로 요약을 해 줍니다 그리고 보통

21:47

런데 키워드까지 적게 돼 있거든요 그래서 키워드를 세 개만 정해 달라고 했습니다 fair

21:53

bth 이렇게 나와 있네요 이런 식으로 여러분들이 간단하게 적어볼 수

21:58

있고 여러분들이 만약에 적다가 영어로 기억이 안 나는 단어들이 있을 수 있어요 그러면 한국어로 적어도 됩니다

22:04

예를 들어서 입학 지원서가 영어로 뭔지 기억이 안 난다 그러면 중간에 이런 것들 한국어 단어로 써도 이런

22:11

식으로 나오게 됩니다가 알아서 이해를 하고 해석을 해 줍니다 이런 식으로 연국 엑서 같은 것도 작성을 해

22:17

봤습니다 연국 서를 작성할 때 주의하셔야 될게 결국에는이 내용들이 어딘가에서 사용되었을 수 있어요

22:24

사용된 것의 조각일 수 있기 때문에 반드시 한번 프레 곧 여러분들의 단어로 고쳐야 됩니다 물론 생성된

22:31

결과를 표절 안 걸리게 다시 패러프레이즈 해 줘라면 해 주긴 하는데 그래도 어 연구 윤리 관점으로

22:37

볼 때 여러분들이 다시 한번 여러분들의 언어로 수정시키는 것을 권장드리고 GPT 언제까지나

22:44

참고용으로 가이드라인 용으로 사용하시길 부탁드리겠습니다 표절이라는 단어가 쵸

22:51

PT 나오면서 되게 모호해지기 했는데 그래도 자신만의 언어로 작성해 본다는게 연구 계획수 작성에는 의의가

22:57

있을 것 같습니다 [음악]

23:10

네 안녕하세요 여러분들 오늘은 화면에 보이시는 것처럼 GPT 기반 언어 모델의 특징 간략하게 한번 요약해

23:17

보도록 하겠습니다 여러분들이 쓰고 있는 어 최 GPT 어떤 원리로 동작이 되고 또 그 안에서 주의의

23:23

할점 그리고 그 주의의 할 점을 지키지 않았을 때 어떤 문제점이 발생할 수 있는지 이렇게 언급을 하고

23:30

그리고 마무리를 하려고 합니다 GPT 기반 언어 모델 굉장히 많은 리소스들이 나오게 되는데 간단하게

23:36

그냥이 한 페이지로 요약이 가능해요이 세 가지 과정만 이해하시면 별다른 긴

23:41

영상 보실 필요 없이 대부분 요약이 되실 겁니다 첫 번째 스텝은 데이터를 얻어서 초기에 학습을 하는 것 그리고

23:48

두 번째는 리워드 모델 정하는 것 세 번째는 그 리워드 모델을 통해서 강화

23:53

학습을 시킨다 이렇게 그림으로 보면 좀 이해가 안 가실 수 있으니까 어 스텝 1에 대해서부터 한 자세히 한번

23:59

볼게요 스텝 1 같은 경우에는 언어형식 해야 돼요 그런데 컴퓨터는

24:06

언어를 숫자로 이해합니다 결국 우리 언어에 갖고 있는 감정이라는 이런 거를 결국엔 다 기계적으로 학습을 할

24:12

수밖에 없어요 그림에 보이시는 가장 간단한 구조인 프리 트레이닝과 파인튜닝 두 가지로 진행이 됩니다

24:19

프리트레이닝 같은 경우는 여기 이미지에 제가 간단한 예시를 가져왔어요 예를 들어서 제가 지금 말을 하고 있잖아요 말을 할 때

24:25

여러분들이 들리는 것에 어색하지 않을 거예요 왜냐면 단어와 단어 사이 문장과 문장 사이가 다 이렇게

24:32

자연스럽게 연결이 되잖아요 그래서 0 지금제 영어 문장으로 예시를 드러났는데 ello My

24:37

Name이라는 세 개의 단어를 제가 입력으로 한번 줬어요 컴퓨터에게 그러면이 컴퓨터는 그다음 단어를

24:44

예측하는 겁니다이라는 단어를 예측하는 거예요 그런데 초기에는 뭐 아무것도 모르니까 그래서이라는 정답을

24:50

알려줍니다 Hello My name 다음에는이가 보통 오더라 해서이를 정답으로 알려 주는 거예요 구글에 뭐

24:55

네이버에 다음에 이런 포털 사이트 등 에이 글로된 문서들을 전부 다 여기에 다음으로 올 단어를 예측한다는 것으로

25:03

학습을 시키는 겁니다 당연히 대규모의 데이터셋이 필요하고 또 리소스도 필요하겠죠 이거를 지금 오픈 AI에서

25:09

GPT 모델에 학습을 시킨 거고 그리고 이렇게 다음 단어로 올 예측 과제를 수행을 하면 그다음에 다음으로

25:16

올 단어 그리고 분류 문제 그리고 유사도 문제과 같이 세부적인 문제로 파인 튜닝이라는 걸 시킵니다 이거는

25:23

트랜스포머 구조를 사용하는 것인데 트랜스포머 구조는 기본적으로 자연어 우리가 말하는이 언어를 컴퓨터가

25:30

이해하기 쉽게 숫자 형태로 바꿔 주고 그 안에서 처리하는 처리 모델이라고 보시면 됩니다 그러면이 스텝 1을

25:36

거치게 되면 컴퓨터가 어떤 상태가 되느냐 인공지능이 다음 단어로 올 예측은 정말 잘하게 됩니다 이렇게

25:43

영어 문장을 주면 다음에 올 문장 레벨 단어 레벨을 상당히 예측을 잘하게 돼요 여기서 그런 예측 문제만

25:50

해결을 하게 되면 발생하는 한계점 아쉬운 점이 다양한 대답을 못 내놓는다는 것이고 보다 나은 대답을

25:57

놓지 못한다라는 그런 아쉬움이 있을 거예요 예를 들어서 제가 여기 리워드 셰이핑라는 여기 슬라이드가 있는데

26:04

제가 최지 PT한테 항공권을 예약하는 방법에 대해 알려 주세요라고 물어봤어요 그러면 GPT 대답을 내

26:10

놓겠죠 이렇게 세 가지의 대답을 내놓는다고 해 볼게요 이들 중에 우리가 보기에 조금 더 좋아 보이는

26:16

대답이 있죠 사용자가 원하는 대답 원하지 않는 대답 선호한 대답 좀 레이블링이 필요합니다 그래서이 오픈

26:22

AI ES 어떤 방법을 썼냐면 사람을 고용해 가지고 GPT게 똑같은 걸 물어보고 여러 가지 대답을 넣잖아요

26:28

어떤 대답이 좋다 어떤 대답이 별로다라고 순위를 매기게 합니다 그렇기 때문에 엄청난 인건비도 들었을

26:34

거예요 그런데 이걸 다 했고 그래서 리워드 모델이라는 걸 만들게 돼요 리워드 모델이라는 걸 만들어서 GPT

26:41

똑같은 질문에 대해 여러 대답을 내놨을 때 순위를 매깁니다이 순위를 토대로 사람이 조금 더 마음에

26:47

들어하는 그런 대답에 대해서 우선 순위를 갖도록 GPT 학습을 시킬 수

26:52

있게 되는 것이고 그게 이제 스텝 3에서 하는 R reforce 러닝이라는 거예요 GPT 같은

26:58

경우에는 ppo 아는 알고리즘을 썼는데이 알고리즘 역시 강화 학습에서는 굉장히 자주 쓰이는

27:04

알고리즘 중에 하나입니다 쉽게 설명드리자면 여기서 우리가 앞에서 구한 리워드 모델이 있고 리워드

27:09

모델이 결국엔 점수예상 주고 3번에 2점을 주고 2번에 1점을 줬다 하면이 점수를

27:17

토대로 다른 프론트에 동일하게 적용을 해서 사람이 조금 더 좋아하도록 거부가 없이 느끼도록 학습을 진행한다

27:24

해가지고 결국에는 그냥 인터넷에서 떠돌다 수수많은 문서들을 마이 되게끔

27:30

대답을 내놓는 그런 학습 모델에서부터 사람이 조금 더 거부감이 없는 모델로

27:35

진화하도록 하는게이 스텝 3까지의 과정입니다 그럼에도 프리 트레에서 오는 한계가 좀 있어요 대규모의 문장

27:42

단위를 예측으로 학습하기 때문에 그리고 결국에는 사람이 레이블링 하는 거에도 한계가 있어요 그렇기 때문에

27:49

GPT 문맥상 어색하지 않으면 그러니까 사람이 느끼기에 문맥상 어색하지 않으면 학습이 잘 되었다고

27:55

판단이 하고 그냥 프롬트 풋으로 내보냅니다 그렇기 때문에 GPT 생성한 결과에이 진니 여부가 확인이

28:02

불가능해요 그래서 제가 예시를 하나 보여 드릴 텐데이 GPT 제가 한번 입력을 해 보겠습니다 뭐라고 입력을

28:08

해 봤냐는 논문을 좀 찾아보려고 해요 그래서 미분 기하에 대한 괴상한 분야기 한데 최신 논문을 알고 싶다

28:15

그렇기 때문에 최신 논문을 좀 정리해 줄 수 있겠느냐 제가 금 최지 피티에 물어봤어요 그랬더니 다섯 개의 논문을

28:22

잘 정리해 줬습니다 심지어 제가 제자 이름 제목 순서도 정리해 달라 했는데 그것도 다 맞춰줬어요 그런데이 논문이

28:29

실제로 있나 찾아봤어요 검색을 해 봤는데 없습니다 이렇게 특히 논문 검색의 GPT 굉장히 취약해요 말이

28:35

되는 거 같으니까 생성을 한 겁니다 그런데 실제로 찾아보면 없는 논문을 이렇게 막 생성을 해냅니다 그렇기

28:41

때문에 여러분들이 꼭 GPT 이용해서 뭔가를 할 때 지니 어부를 확인을 하셔야 됩니다 보고서라는 작성을 하실

28:48

때 우선 GPT 도움을 받고 그 안에 있는 내용 하나 하나는 아직까지는 수작업으로 확인을 하셔야 잘못된

28:55

정보를 전달하는 일은 없을 것입니다 잘못된 정보 전달이 올 수 있는 이유는 프리트레이닝 모델을 사용하기

29:02

때문이고 프리 트레이닝은 인터넷에서 돌아다니는 수많은 문서들 이용해서 학습을 하는 것이기 때문에 그중에

29:08

잘못된 정보도 있을 것이고 사람의 편견이 들어간 정보도 분명히 있을 거예요 그렇기 때문에 아직까지는

29:13

GPT 활용할 때 조심을 하셔야 된다는 겁니다 간단하게 GPT 언어 모델 요약하자면 세 개의 스텝으로

29:20

이루어져 있고 첫 번째 스텝에서 프리트레이닝 이용하기 때문에 진위 여부에 대해서는 조금 조심하셔야

29:26

된다라는 부분 분으로 오늘 이렇게 설명 마치도록 하겠습니다

29:32

[박수] [음악]

29:42

감사합니다 바디에도 해보고 채집 비에도 해볼 때 뭐 거의 막상 막하고 쓰기 나름인 거 같아요 그런데 지금

29:50

출력 결과가 뭔가 좀 이상하죠 [음악]

29:55

그죠네 안녕하세요 세요 이번 영상에서는 처치 PT 대항마로 떠오르고 있는 바드에 대해서 좀

30:02

살펴볼 건데요 특징 그리고 사용법 간단하게 알려 드리고 똑같은 질문을 바에도 해보고 최지 비에도 해 볼 때

30:09

어떻게 다른지 좀 살펴보도록 하겠습니다 그래서 바드 자체가 구글에서 만든 거기 때문에 구글에다가

30:15

그냥 .google.com 이렇게 치면 바드 페이지가 바로 나오게 됩니다 참고로 바드는 지금 실험 베타

30:22

버전이에요 그렇기 때문에 아직 정식으로 출신 되지 않았는데 그럼에도 지금 로그인만 하면 이렇게 프롬프트가

30:28

나오고 입력을 할 수 있습니다 기본적으로 채지 피트라 똑같이 생겼어요 명령 프롬프트에 여러분들

30:34

뭔가 입력할 수 있게 돼 있거든요 뭔가를 한번 입력을 해 보죠 그냥 진짜 인사 한번 해 볼게요 헬로 해 볼게요 피에도 똑같이 헬로 해볼게요

30:42

똑같은 답변 나오죠 여기서 바드만이 갖고 있는 특징 중에 하나 다른 답안 보기라는게 있어요 보시면은 답안 1

30:48

답안 2 이렇게 있거든요 약간 다른 언어 모델을 사용하든지 파라미터를 약간 조작하는 거긴 한데 이렇게

30:54

다양한 답안을 얻을 수 있다라는 아주 작은 차이점이 있어요 조금 고급진

31:00

거를 한번 물어볼게요 자 내가 어떤 수학 분야에 대해서 공부를 하고 싶은데 어떻게 시작을 하면 될까요

31:06

영어로 물어봤습니다 똑같이 GPT 게도 물어봤습니다네 이런 식으로 바드가 답변을 내놓았고 GPT 답변을

31:15

내놓고 있습니다 여기서 보시면 GPT 다 바드가 조금 더 빠릅니다 최소화가

31:20

좀 잘 돼 있고 GPT 조금 느리긴 하지만 그래도 이렇게 답변을 내 놓는 모습이에요 이게 사용 자 순간 접속자

31:28

수 차이에서도 발생할 수 있는 문제라 속도 같은 경우에는 크게 신경을 쓰지 않으셔도 될 거 같고 역시나 다른

31:34

답안도 가능하다라는 것입니다 그래서 내놓는 답변들은 비슷해요 텍스트북 하고 뭐 온라인 리소스 있다 여기도

31:42

터디 텍스트북 있고 이런 것들이 있다 여기는 키워드 개념 위주로 알려줬네요 그래서 비슷해 보인다라는 것입니다

31:49

와드에서 조금 더 제가 장점이라고 생각하는 거는 한국어 최적화 있는데요 자 이렇게 한국어로 그냥 지금 아무

31:57

거나 물어봤습니다 이렇게 답안을 내놨네요 여기 같은 경우는 짧게 지금 답안을 내놨고 바드 같은 경우는 거의

32:04

위키 수준으로 답을 내놨습니다 한국어 최적화라는 이유가 구글 같은 경우에는 그래도 나와 있는 한국어 문서들이

32:11

많아요 하지만 GPT 오픈 a 같은 경우는 한국어로 학습된게 굉장히 적습니다 그렇기 때문에 한국어로

32:17

여러분들이 주고받을 때는 어쩔 수 없이 바드가 조금 더 속도가 빠를 수밖에 없어요 그래서 지금 보시면

32:24

내놓는 답변도 GPT 조금 짧아요 그렇기 때문에 한국어로 하시는게 편하다 하면 바드를

32:31

추천드립니다 지금 여기 보시면 마음에 들어요 마음에 들지 않아요 이거 있는데 실험 버전이라서 이런 답변들에

32:38

다 레이블을 할 수 있도록 하는 거 같아요 바드를 사용할 때는 한국어로 물어봐도 무방하다는 것입니다

32:45

마지막으로 해볼 거는 간단한 코딩 하나만 요청을 해 볼게요 짧은 코딩을 한국어로 피티와 바에게 물어봤습니다

32:52

번 볼까요 이런 식으로 바로 파이썬 코드가 나왔네요 여기도 바로 파이썬 코드가 나왔네요 간단한 코드라서

32:59

GPT 같은 경우는 조금 더 tmi 이렇게 해 주는 모습입니다 코딩 같은 경우도 이런 식으로 잘 된다라는 것을

33:05

여러분들에게 확인을 해 드렸습니다 기본적으로 GPT 럼 사용을 할 수 있고 한국어 추 적화가 더 잘 되어

33:12

있기 때문에 영어에 익숙하지 않으시다면 바드를 사용하는 것을 추천을 드립니다 그리고 최근에 결과를

33:19

보면 아직까지도 뭐 고차원적인 문제 해결 예를 들어서 SAT든지 수능 문제 풀어보는 거 똑같이 GPT

33:26

바드에 물어보면 면 거의 막상 막하 GPT 좋거나 이런 경우도 있는데 결국에는 쓰기 나름인 거 같아요 다만

33:33

한국어는 바드 잘통한다이 정도로 알아주시면 될 거 같습니다 바드에

33:38

채팅 초기하 싶으면 여기 채팅 재설정 누르면 바로 깔끔하게 사라지고 바둑

33:43

활동 내역에 대해서는 여러분들이 이렇게 삭제를 하셔서 개인 정보

33:49

관련한 문제도 좀 해결하시면 좋을 것 같습니다네 이렇게 간단하게 살펴봤고

33:54

운성 인식 기능도 있는데 여러분들이 한번 사용을 해 보셨으면 좋겠어요 그래서 바드를 통해서 또 하나 언어

34:01

모델 여러분들이 편리하게 사용을 해 봤으면 좋겠습니다 영상 마치도록

34:18

하겠습니다네 안녕하세요 이번 영상에서는 최치 pt's 개발한 어 GPT 4 모델에 대해서 설명을

34:24

드리려고 하는데요

34:29

최 GPT 사용해 보신 분들은 이렇게 위에 GPT 3.5와 GPT 4라는

34:35

두 개의 카테고리로 생겼다는 것을 확인을 했을 거예요 GPT 3.5는 우리가 무료로 사용할 수 있었는데

34:41

GPT 4 같은 경우는 돈을 내야 됩니다 메뉴에 보시면 마이 플랜이라고 있고지 BT 플러스라는 것이 있습니다

34:48

제가 구독을 해 놓은 상태이고 여러분도 만약에 사용하고 싶으면 플랜 들어가서 결제를 하시면 바로 사용을

34:54

할 수 있습니다 GPD 4에서 세팅스 들어가면 여기 베타 피처 실험 실이라고 하는데 코드 인터프리터

35:01

활성화를 해 주시면 디에서 현재 개발하고 있는 새로운 기능을 체험을 해 볼 수가 있어요 활성화시킨

35:07

상태에서 GPT 4를 누르고 GPT 4를 누른 상태에서 여기 코드 인터프리터에 체크 표시가 나오게 여기

35:14

플러스라는게 생기고 업로드 파일이라는게 생겨요 디폴트에서는 그냥 안녕이라고 보낼 수 있었던 최

35:20

기능에서 벗어나서 새로운 파일을 업로드 할 수 있는 기능이 생겼다는 건데 그래서 어떤 파일을 업로드하고

35:26

이 파일에 대해서 지의 응답을 할 수 있다는 것이죠 제가 예시 데이터를 좀 준비해 봤는데 케이라는 마음대로

35:33

데이터를 다운로드 받을 수 있는 사이트예요 올림픽 데이터를 가져와 봤고 엑셀 파일에 담겨져 있어요 엑셀

35:39

파일을 업로드를 하면 이렇게 파일 자체가 올라갑니다 지금이 파일에서 제가 뭘 하고 싶냐면이 파일에 뭐가

35:46

있느냐 요약해 달라라고 한번 부탁을 해 볼게요 요약만 해 줘라고 하면 작업을 시작합니다 어떤 데이터를 담은

35:53

거구나 아고 바로 설명을 해 줍니다 보시면 이런 식으로 된 데이터이다

35:59

지금 요약을 해 주고 있습니다 여기서 인사이트 같은 걸 원하라 해서 제가 한번 통계적인 분석을 해 달라라고

36:05

했습니다 그러면이 친구가 또 뭔 작업을 시작을 해요 그리고 바로 평균 연령이 그지 최대 최소 나이라는 이런

36:12

거 다 나와요 GPT 4가 뭘 하길래 이런 정보들을 실시간으로 내놓느냐라고

36:17

궁금해하실 분들이 좀 많을 것 같아요 그래서 여기 피니 working 옆에 보면 쇼라고 돼 있죠 뭔가 나타나요

36:24

이게 뭔가 보니 파이썬 코드입니다 결국에는 GPT 4의 베타 버전에서 하는 것들이이 파일을 처리하기 위한

36:30

파이썬 코드를 짜 주고이 파이썬 코드의 실행 결과를 보기 좋게 출력을 해 준다는 거예요 결국에는 엑엑셀

36:37

파일을 넣었을 때 엑셀 파일을 효과적으로 읽고 분석하는 코드를 짜 주는 거예요 단순히 그냥이 결과를

36:44

활용할 것이 아니라 이러한 파이썬 코드들을 여러분들이 전략적으로 활용을 할 수 있다는 것이죠 gpt3 3.5

36:50

기능에서는 이러한 데이터가 있을 때 여기서 내가 서머리 하 하기 위한 코드를 짜 줘라고 했으면 지금은 그냥

36:57

파일 올리고 바로 결과를 볼 수 있다는 장점이 있습니다 엑셀 파일 해

37:02

봤으니까 이번에는 이미지 파일을 한번 해보고 싶은데는 뉴스를 한번가 볼게요네 이렇게 많은 뉴스들이 지금

37:10

떠 있어요이 뉴스 화면을 캡처를 해서 지금 한번 올려 보겠습니다 이미지

37:16

안에 어떤 일이 일어나고 있는지 어떤 내용들이 담겨 있는지 연적을 해 달라라고 했습니다 그러면이 친구가 또

37:22

뭔가 작업을 시작을 하죠 이런 식으로 뭐 뭐가 있다 뭐가 있다 나옵니다 뉴스 내용들을 다 글로서 요약을 해

37:28

줍니다 그래서이 친구가 또 어떤 작업을 했냐 봤더니 이미지에서 어떤 특정한 단어들을 꼽아내는 그래서

37:36

단어들을 다 추출 했죠이 추출한 단어들을 이런 식으로 요약을 해 준 겁니다 그러면 우리나라 뉴스에서도 볼

37:42

수 있지 않을까라고 생각을 해서 제가이 스포츠 화면을 또 캡처를 해서 도전을 해 봤습니다 똑같이 한번

37:49

작업을 요청을 해 볼게요 결과를 놓을 준비를 하고 있습니다 볼까요 여기

37:55

뭐라고 했죠 아 잘 클리어하지 않다라고 나와 있죠이 GPT 아는 거 자체가 사실은 한국어를 잘 인식을 못

38:03

하기도 하지만 리 지금 사용했던이 함수 있잖아요이 함수 자체가 한국어에 대해서 잘 캡처를 하지 못하는

38:10

상황인가 봐요 GPT 자체가 결국에는 파이썬 코드를 출력하고이 파이썬 코드 작업 결과를 내놓는 거기 때문에 함수

38:17

자체가 한국어 지원이 안 되면 사실은 할 수 없어요 그래서 아직은 한국어 데이터 처리에 대해서는 조금 어 되지

38:24

않는 상황입니다 하지만 뭐 영어로 된 데이터에서는 잘 작동을 하기 때문에 여러분들이 그런 데이터 처리에 관심이

38:31

있으시면 한번 적극적으로이 gpt4 기능을 활용을 하시면 좋겠습니다 이렇게 gbt 4에 있는 베타 기능

38:38

파일을 업로드해서이 파일을 처리하는 거를 알아봤고이 이미지의 크기를 한번

38:44

알려 달라고 해 볼게요 이렇게 930 * 903 픽셀이다 나오잖아요 또 뭘

38:49

할 수 있냐면 이미지를 절반으로 압축해 달라고 해 볼게요 다운로드를 한번 해보도록 하겠습니다 정사각형으로

38:55

이미지가 바뀌는 것을 볼 수 있습니다 이렇게 좀 살펴봤고 이미지 같은 것도

39:02

처리를 할 수 있다 물론 직접 처리하는 것은 아니고 파이썬 통해서 처리를 하는 겁니다 그리고

39:07

여러분들이이 파이썬 코드를 직접 활용할 수 있다는 장점도 있고요 hpt 4.5의 베타버전 기능에

39:13

대해서 간단히 알아봤고 영상을 마치도록 [음악] [박수]

39:25

하겠습니다 네 이번 영상에서는 라지 랭귀지

39:31

모델이라는 거를 주제로 이야기를 해보도록 [음악]

39:38

하겠습니다 LM 모델이라는 것이 라지 랭지 모델의 약자인데 대규모 언어를

39:43

다루는 모델입니다 새로운 개념인가고 생각하실 수도 있어요 크게 다를 거는 없고 대규모 모델을 다루고 있다는

39:49

점에서 요즘 트렌디하게 만들고 있는 거 같습니다 라즈 랭지 모델이 뭐니 하고 gbt 테 물어봤더니 방대 대한

39:56

양의 데이터로부터 인간의 언어와 유사한 그런 텍스트를 어 이해하고 그리고 만들어 된다라고 돼 있고 밑에

40:03

줄에 nlp 테스크를 사용한다라고 돼 있습니다 결국에는 제가 이야기하고 있는 한국어부터 시작해 가지고 영어

40:10

혹은 기계어 하나의 언어라고 볼 수 있기 때문에 이러한 언어들을 처리하는 것이 어 랭귀지 모델이고 그 언어들을

40:17

처리할 때 방대한 양의 학습 데이터를 사용했다 혹은 꽤나 많은 양의 리소스를 사용한다 하면 라즈 랭지

40:24

모델이 되는 겁니다 번역이라 혹은 오타를 수정한다는 물어보면 거기에 대한 답을 한다든지 혹은 뭐 요약을

40:31

할 수도 있고 그냥 일반적인 대화를 생성할 수도 있습니다 그런 것들이 다 라즈 랭지 모델의 태스크 중에서

40:38

이루어질 수 있는 것이고요 그래도 nlp llm 대해서 비교는 해 봐야겠죠 거의 같은 개념이지만 llm

40:45

경우는 nlp 한 분야이자 굉장히 큰 데이터 셋만 쓴다라는 것이 차이만

40:51

있다라는 것을 기억해 주시면 될 거 같습니다 그래서 LM이 어떻게 게

40:56

최종적으로 구성이 되어 있는지 한번 제가 외부에서 그림을 가져와 봤는데요 이렇게 라지 랭지 모델이 있고 라지

41:03

랭지 모델에서 어떤 언어 모델을 학습을 할 거예요 언어 모델을 학습을 할 때 주로 인터넷에서 있는 소스들을

41:10

많이 사용합니다 실제로 최치 PT 학습을 할 때 사용한 리소스들이 인터넷에 있는 문서들 뭐 대화들 다

41:18

끌어 모아서 그 구조를 학습한 거예요 그래서이 노리지

41:23

리스라시르의 합니다 지금 여기 1번 보시면 프롬트 쿼리는 처지 피라고

41:28

한다면 제가 아까 러즈 연지 모델이 뭐니라고 질문했던 것처럼 그런 질문들을 입력을 하면 여기서 찾겠죠

41:34

최종적으로 라즈 랭지 모델을 거쳐서 대답을 내놓게 된다라고 하고 있습니다 뭐 이렇게 이루어지는 것도 있고 그냥

41:41

뉴로 네트워크 모델을 통과해서 즉각적으로 대답을 내놓는 경우도 있습니다 그러면 우리가 질문을 하면

41:47

여기에 대한 대답을 결국엔 라지 랭지 모델에서 내놓아야 되잖아요 그 내놓는 과정을 어떻게 처리를 하고 있는지

41:54

한번 보겠습니다 지금 오른쪽 쪽에 모시는 그림이 트랜스포머 구조고 여기 인풋과 아웃풋 레이어로 구성이 되어

42:01

있는 것을 볼 수 있어요 인풋에 질문하는 거 GPT 뭐 질문을 한다면 그러한 것들이 다 인풋에 들어가는

42:07

거고 그것이 아웃풋 단으로 넘어가서이 아웃풋 단에서는 대답을 생성하는 것이라고 보면 되거든요 여기서 중요한

42:14

것이 왼쪽 그림에 있는 셀프 어텐션이라는 겁니다 기본적인 딥러닝 모델 예를 들어서 이미지를 분류한다는

42:21

글씨가 어떤 글자인지를 분류한다는 이런 분류 모델은 데이터 자체 의 특징만 뽑아내면 됐었어요 그런데 언어

42:29

같은 경우는 결국에는 시간에 따라서 계속해서 내가 어떠한 소리를 말을 하고 있는 거잖아요 근데 그 말을

42:34

하고 있는 것이 인과 관계가 있어요 예를 들어서 뭐 한국어 같은 경우는 주어 다음에 목적어 다음 동사가 오고

42:40

영어 같은 경우는 주어 동사 목적어 이런 순으로 어순이 아는 것이 있고 그리고 그 문장이 모여서 문단을

42:46

형성할 때 문장과 문장 사이에도 어떠한 관계가 있어요 그러한 관계들을

42:52

찾는 것이 셀프 텐션이라 구조에서 우리가 찾을 수 있거든요 같은 문장 한 문장 내에서 단어와 단어 사이의

42:59

연관관계를 상관관계를 보는 겁니다 그래서 지금이 문장 사이에서이라는

43:04

것이 가르키는 것이 애니멀이 그든 그래서이 두 개의 연관성이 높다라고

43:09

하고이 애니멀이 걸 분석을 할 때 자기 문장에 있는 다른 단어인 이세 이세 조금 더 가중치를 두는 거예요

43:16

이런 식으로 언어의 구조에 대한 이해 어떻게 하면 조금 더 자연스럽게 말을 할 수 있는지를 컴퓨터가 학습을 하게

43:22

되는 것입니다 데이터셋 같은 경우는 인터넷에서 있는 방대한 양의 텍스트 데이터를 모은다고 했잖아요 논문 같은

43:29

전문적인 것부터 그냥 일반적인 인터넷의 글처럼 조금 문법이 틀릴 수도 있는 혹은 어순이 안 맞을 수도

43:35

있는 그런 데이터까지 다 포함하는 겁니다 결국에는 언어에 대한 구조를 배울뿐만 아니라 널리 알려진

43:41

지식까지도 다 습득을 할 수 있는 거예요 그리고이 지식들을 습득을 할 때 월드 임베딩이 것을 이제 사용을

43:47

하게 되는데 월드 임베딩이란게 무엇이냐면 결국에는 이런 단어와 단어들이 컴퓨터가 이해하려면 숫자로

43:54

변환이 돼야 돼요 숫자로 변환을 할 때 데 조금 더 연관성이 높은 단어들은 유사한 숫자들 그리 묶이는

44:00

겁니다 여기 수도와 국가가 지금 다 이렇게 짝지어져 있어요 이것들을 다

44:05

하나의 숫자로 할당을 한다고 생각을 할 때 어 같은 국가와 도시의 묶음들이 같은 숫자로 좀 비슷한

44:12

거리에 있는 숫자들로 묶인다는 겁니다 이것이 월드 임베딩의 원리인데 위에처럼 셀프 텐션을 활용한 이런

44:18

기본적인 언어 모델을 사용하면 비슷한 것들은 비슷한 숫자로 맵핑이 된다는 것을 확인을 할 수 있어요 그래서

44:25

이것이 월드 임베딩의 특징이고 그래서 결국에는 어떤 특정한 태스크 즉 손글씨 분류 혹은 뭐 뭐 예측 같은

44:33

특정한 태스크를 목적으로 학습을 하는 것이 아니라 언어 모델 자체의 것을 학습을 하기 때문에 반화 돼 있어요

44:39

굉장히 예를 들어서 분류 문제라든지 혹은 내가 어떤 텍스트를 넣었을 때이 텍스트가 부정적인 감정을 담고 있는지

44:46

긍정적인 감정을 담고 있는지 그러한 특정한 문제를 풀고 싶을 때는이 라지 랭귀지 모델을 갖고 와서 거기서

44:52

파인튜닝 즉 여러분들의 데이터로 조금 더 학습을 시 시키는 겁니다 llm 자체가 이런 파인 튜닝을 할 수

44:59

있도록 잘 설계가 되어 있어요 최지 PT 같은 경우도 사실은 gpt3 GPT 4라는 이런 사전 학습

45:05

모델에서 맞춤형으로 이제 발전이 된 거거든요 그래서 이렇게 파인 튜닝해 사용할 수 있다라는

45:12

것입니다 하나 문제점을 알려 드리자면 인터넷에 있는 방대한 양의 자료를

45:17

가져와서 학습을 한다고 했잖아요 뭐 지식도 학습을 한다고 할 수 있는데 스피치라고 혐오 발언 증오 발언이라고

45:23

하는 건데 결국에는 노출될 수밖에 없 없어요 그러 이러 것들이 다 학습이 되고 사람들이 다 걸러 줘야 된다는

45:29

거죠 가짜 뉴스를 생성한다는 갈등을 유발할 수 있는 문제들을 해결하는 것이 지금 LM 모델에서 사람들이

45:36

연구하고 있는 분야들 중에 하나입니다 또한이 GPT 포함해서 굉장히 모델 자체가 커요 그렇다 보니까 결국에는

45:44

그 모델을 저장하고 관리하기 위해서 전기세가 많이 나갑니다 우리가 상상할 수 없는 많은 양의 메모리가 필요

45:50

필요한데 어 전기세가 감당이 안 될 정도라고 합니다 그래서 이러한 리소스 관리 같은 것도 LM 주요 과제라고

45:57

볼 수 있고요 당연히 인터넷에는 영어 스페인어 이런 것들이 많고 한국어 같은 경우에는 비교적 적어요 그렇기

46:04

때문에 티에도 한국어를 입력하면 생성하는 속도가 좀 느립니다 아직까지도 LM 모델에서는 데이터가

46:10

적은 한국어는 비주류에 속하기 때문에 비주류 언어에 대해서도 개발을 하려는 것이 많은 기업들과 연구소에서 하고

46:17

있는 것들입니다 이렇게 LM 대해서 가볍게 한번 알아봤고 영상 마무리하도록

46:24

하겠습니다

46:36

안녕하세요 이번 영상에서는 최근에 최지 피트의 대화 기능이 추가되었다고 해서 저도 한번 사용하려고 해보려고

46:42

합니다 hgpt 대화 기능을 사용하기 위해서는 데스크탑이 아닌 패드 혹은 스마트폰 환경에서 사용을 해야

46:47

되는데요 기본적으로 GPT 어플 최지 PT 어플을 다운로드 받으셔야 합니다 익스플로러 창에서 하는 것이 아니라

46:54

직접적으로 여러분들이 어플에 깔 하는 것 우선 알아두시면 좋을 것 같고 이렇게 어플을 들어가 보면 기본적으로

47:01

메시지를 입력할 수 있는 창이 나와 있어요이 창 위에 보시면 여기 위에 보시면 어 헤드폰 헤드셋을 헤드셋

47:09

아이콘이 있는데이 헤드셋 아이콘을 클릭을 하면 GPT 대화 기능이 시작이 됩니다 만약이 기능이 보이시지

47:16

않는 분들은 여기 세팅을 들어가셔서 세팅에서 직접 활성화할 수 있는

47:21

기능이 있을 거예요 만약에 이것이 없다면 이게 아직 베타 버전이기 때문에 랜덤으로 지금 부여가 된

47:27

상황이에요 그래서 어 정식으로 출시가 될 때까지 기다려 주시면 감사하겠습니다 그래서 한번 켜보도록

47:33

하겠습니다 그러면 이렇게 문구가 뜨다가네 지금 저의 제 말을 듣고

47:39

있네요 우선은 제가

47:45

한번네 제가 한번 물어 물어보도록

47:54

하겠습니다 네 이런 식으로 조금 딜레이가 있지만 제발 알아듣는 것을 확인을 할 수

48:00

있어요 다른 걸 한번

48:11

물어볼게요네 이런 식으로 대화가 가능한데 지금 완벽하지는 않은

48:16

모양이에요 제가 분명히 나한테 무가를 물어봐라 했는데 지금 다른 대답을 내놓고 있잖아요 이렇게 아직까지

48:24

GPT 뭘 물어보지는 못해요 그런데 제가 뭘 물어볼 경우에는 GPT

48:29

능동적으로 대답해줄 수가 있습니다 예를 들어서 뭐 이런 걸 한번

48:54

물어볼게요 are AB I want to

49:02

relax for their serene landscape and comfortable accommodation think about a beach

49:08

destination like the males or the caribbean for sun sand and If you prefer a cooler

49:13

climate maybe a mountain retreat in the swiss or the Canadian rockies could offer you

49:18

Peace and

49:24

traps 네 이런 식으로 들어봤어요 기본적으로 조금 말이 많습니다 말이 많기 때문에

49:31

어 좀 듣는데 시간이 좀 걸릴 수 있습니다 그래서 짧게 짧게 대답을 해

49:36

달라고 요정을 할 수도 있어요 제 영어로 회화를 해 봤었는데요 한국어로 대답을 해 달라고 해 보겠습니다

49:41

한국어로 한번 물어볼게요 안녕 안녕하세요 어떻게

49:47

도와드릴까요네 이런 식으로 제가 한국어를 물어보면 한국어로 대답을 해주고 언어도 감지할 수 있는 기능이

49:54

지금 탑재되어 있는 상황입니다 그래서 이렇게 뭐 영어 영어도 되고 한국어도 되고 다양한 언어가 가능은 합니다만

50:01

영어가 아직까지는 성능이 좋습니다 그래서 영어 말고 다른 언어 같은 경우는 되긴 하지만 성능이 그렇게까지

50:07

많이 나오진 않는다 좀 틀린 대답을 내놓을 수 있다라는 것을 염려해 주시면 될 것 같습니다 이거를 뭐 여행 갔을 때

50:15

사용하면 되게 좋을 것 같아요 그래서 유럽 여행을 갔는데 그 나라 언어가 안 된다지 하면 이거를 직접 물어볼

50:21

수도 있을 것 같습니다 예를 들어서 뭐 프랑스로 여행을 갔다 할게요 지하철 타려 어디로 가야 하 하나라고

50:27

물어보려고 프랑스어로 어떻게 물어보는지 한번 물어보겠습니다 프랑스어로 지하철을 타려면 어디로

50:33

가야 하나요 어떻게 말하나요 프스 지하철을 타려면 어로 가야

50:41

하나요 말할어요 더 물어볼 거 없으니까 여기까지 하도록 하겠습니다 이런

50:47

식으로 번역까지 가능하다라는 것을 알아두면 좋고 되게 여행갈 때 되게

50:52

유용하게 사용할 수 있을 것 같아요 그리고 방금 기억이 안 날 수도 있잖아요 기억이 안 날 수도 있기

50:57

때문에 대화 기능을 끄고 밖으로 나와보면 이때까지 내가 했던 물어봤던 것들 그리고 이제제 답변했던 것들

51:04

전부 다 이렇게 로그로 남아져 있습니다 그래서 보시면은 지금 제가 물어보지 않았더라도 하고 있는 말도

51:10

다 지금 녹화가 녹음이 된 모양이에요 그래서 이런 식으로 여러분들이 확인하고 또 다시 복귀를 할 수

51:17

있다라는 정도를 알아두시면 될 거 같습니다 그래서 이런 거를 이용해서 영어 회화를 공부한다던 아니면 말하는

51:23

거를 연습한지 하면 상이 여러분들이 스스로 영어 회화를 공부하거나 혹

51:28

외국어를 공부할 때 사용을 할 수 있을 것 같아요 주의 사항이 있다면 언어를 섞어 사용하면 성능이 좀

51:35

떨어지는 현상이 발생을 합니다 예를 들어서 영어로 물어봤다가 그리고 한국어로 물어봤다가 혹은 한국어로

51:41

프랑스어를 번역해 주세요 했다가 영어로 일본어로 번역해 주세요 이런 식으로 하면이 친구가 언어를 섞어서

51:46

대답을 내놓는 경우가 있습니다 그래서 여러분들이 가급적이면 한 대화 실전에서는 하나의 언어를 사용하고

51:53

그리고 되도록이면 영어를 사용하면 좋지만 불가피할 경우에는 한국어도 가능하다라는 걸 알아두시면 좋을 것

51:59

같습니다 역시나 기본 취지 루를 따르기 때문에 어 금지되어 있는

52:04

단어들 혹은 문장들은 여전히 똑같이 나온다는 것 확인을 하고 잘 유용하게

52:10

사용해 주셨으면 감사하겠습니다 이렇게 GPT 대화 기능에 대해서 알아보았고 베타

52:15

버전이지만 계 앞으로 계속 출시가 된다면 여러분들이 잘 사용할 수 있을 것이라고 생각합니다 영상

52:24

마치겠습니다 [음악]

728x90

LIST

저작자표시

'say와 AI 챗봇친구 만들기 보고서' 카테고리의 다른 글

구글이 발표한 SELF-DISCOVER 기술 [LLM이 스스로 추론 구조를 발견하면서 GPT4도 Gemini도 모두 성능이 좋아집니다!] (0)	2024.02.21
동영상이 이제 정말 자연스럽게 생성됩니다. Runway, Pika Lab, Stable Video Diffusion 모두 이겨버린 구글... [압도적 성능의 이유는 시공간 결합?] (0)	2024.01.30
[자막뉴스] 챗GPT 시대 '사용법' "이거 모르면 망한다~" (0)	2024.01.25
저글링 2~3마리 모았더니 울트라리스크가... [작은 AI 모델을 섞기만 하면 GPT3.5보다 성능이 좋다는데 이건 온디바이스AI 혁명입니다] (2)	2024.01.25
2024년 인생 자동화 AI 툴 14가지 (1)	2023.12.31

티스토리툴바