챗GPT 원리/LLM /산업영향/코딩구현 모든걸 이 영상 하나로 끝내드립니다ㅣ서울대 AI박사 - 메타코드M
#챗gpt #생성형ai #llm 챗GPT에 관한 모든 기초 내용을 이 영상 하나로 끝내드립니다 ▶챗GPT 관련 IT현직자 강의 https://mcode.co.kr ▶자연어 처리 무료강의 바로보기 https://mcode.co.kr ▶ AI / 데이터사이언스 현직자 커리어 특강 바로보기 https://mcode.co.kr ▶출연문의 contact us (강의 촬영 / 현직자 개인 브랜딩 / 회사홍보) support@mcode.co.kr
여러분 모두 요즘 핫한 최지 PT 아시죠 최지 피티는 내가 원하는 대답을 얻을 수 있는 세포입니다
0:06
그래서 혁신입니다 [음악]
0:12
안녕하세요 저는 서울대학교 기계 공학부에서 박사과정으로 제약 중인 김동욱이 합니다 최치 BT 같은
0:19
경우는 우리가 흔히 알고 있는 어 체포 있니다 차보이고 하는 건데 체포 같은 경우에는 기존의 네이버라는 다른
0:26
어플들로 개발이 되었었는데이 채지 피트라는 체포 같은 경우에는 GPT 아는 기본 알고리즘을 가지고 동작하는
0:34
인공지능 기반 차보이고 할 수 있습니다 우선 차보이고 하면 우리가 사람대 사람으로 얘기할 때는 제가
0:40
지금 말하는게 한국어인데 이런 한국어 영어 불어 이런 것들이 다 자연 어이고 사람이랑 기계랑 대화를 할
0:47
때는 기계가 알아들을 수 있게 좀 바꿔 줘야 됩니다 기계가 알아들을 수 있는 언어를 기계어 아고 하고 이런
0:54
한글 영어 같은 추상적인 개념이 아니라 0과 1로 이루어진 즉 기계가 알아들을 수 있는 숫자로 이루어 진
1:00
언어를 기기라고 합니다 우리가 우선 기본적인 한국어 영어를 지피에 입력을
1:05
하게 되면 그 입력된 언어가 서버로 전달이 돼서 거기서 각 단어마다 부여된 고유의 숫자가 있습니다 각
1:12
단어마다 부여된 숫자로 바꾸는 과정을 우리가 토큰 화라고 하는데 그 토큰화된 숫자를 가지고 처리를 해서
1:19
그 결과를 다시 언어로 바꾸어서 출력을 하는 그런 알고리즘을 GPT 갖고 있습니다 우선 저희가 10년
1:27
전에는 심심이는 폰 어플리케이션 체포 있었고 그리고 네이버라는 이제 이런
1:33
다른 어 한국 업체에서도 체포에 개발한 적이 있었는데 그런 것들 경우에는 단어를 위주로 키워드만
1:40
골라내 가지고 거기에 대한 답변을 미리 하도록 정해 놓은 흔님 말에 정답이 정해져 있는 그런 체포
1:46
위주라고 보시면 됩니다 최 GPT 같은 경우에는 우선 기본적으로 방대한 양의 자료 즉 우리가 구글링하면
1:52
나오는 어떠한 자료도 다 학습이 되어 있다고 볼 수 있고 그런 것들을 맞추어서 정해진 대답을 내놓는게
1:57
아니라 확률에 맞는 대답을 내놓는 겁니다 예를 예를 들어서 오늘 날씨가 맑아 너는 어떻게 생각해라고 물으면
2:03
날씨 다음에 올 대답에 관련된 단어 중에 확률이 가장 높은 단어들을 우선적으로 내뱉는 거죠 유약하지만
2:10
확률 기반으로 다음 대답을 내놓는 것이 최치 PT 가장 큰 장점이라고
2:15
볼 수 있습니다 우선 빅데이터 즉 우리가 머신 러닝 이런 딥러닝 세계에서 데이터가 많으면 많을수록
2:21
사실은 좋습니다 그래서 어 구글이라는 이런 방대한 데이터를 GPT 알 수
2:26
있게 일목 요연하게 정리를 하고 그렇기 때문에 우선 데이터가 많으면 많을수록 성능이 좋습니다 그래서 최
2:33
gptn 그 많은 데이터들을 효과적으로 학습을 하고 분류를 한 거죠 검사액이라 하기보다는 우리가
2:39
원하는 대답을 우리 레벨에 맞춰서 내놓을 수 있다는게 가장 큰 장점이죠 예시를 들어서 어 내가 만약에 어떤
2:45
프로그램을 짜고 싶은데 그 프로그램을 짜려면 내가 직접 프로그램을 짜는 건 나오고 그거에 대한 명령어를 이전에는
2:52
검색을 해서 찾아야 했다면 지금은 프로그램을 짜 줘라고 최 GPT게 이야기를 하면 프로그램을 직접 GPT
2:59
짜 주는 거죠 그래서 우리가 원하는 것 이상으로 결과물을 얻을 수 있다는게 검색 엔진과 큰 차이라고 볼
3:05
수 있습니다 쉽게 말해서 답이 정해져 있는 것들에 대한 작업을 전부 다
3:10
최치 PT 웬만하면 대체를 할 수 있는 것이죠 예를 들어서 법률 같은 경우에는 바뀌지 않는 이상 항상
3:16
똑같은 대답을 내놨습니다 그래서 쉽게 말해서 변호사를 대체할 수도 있는 것이고 판사를 대체할 수도 있는
3:22
것이고 반복적인 작업을 하는 1년의 코딩 프로그래머도 많이 대체를 할 수 있는 것이죠 우리의 생각이 그렇게
3:28
많이 필요하지 않은 작업들은 전부다 대체를 할 수 있습니다 어 인간이 가지고 있는 직업에 대해서 위협은
3:34
하지만 대체를 할 수는 없는 것이 결국에 최종적인 판단을 내리는 것은 인간이고 최종적인 결정 권자는 이제
3:40
인간이 가지고 있습니다 최지 BT 그런 주관적인 결정까지는 아직 내릴 수 없고 그게 지금까지 인공지능의
3:46
한계이기도 하기 때문입니다 가장 파급력이 뛰어난 분야는 우선 자동 번역 실시간 번역 이런 언어와 언어
3:52
사이의 교환이 이루어지는 것이죠 아무래도 언어 모델이기 때문에 말을 실시간으로 빨리 번역을 한다던가 일보
3:59
교회 하게 요약을 하는 등의 작업에 가장 많이 파급이 될 것입니다 우선적으로 미국 국회의원이 연설문을
4:05
최치 피트로 작성하면서 실제로 발표를 한 것을 보셨을지 모르겠는데 그런 거만큼 어 기본적으로 우리가 단순히
4:12
생각하는 사무 노동이라고 생각하는 것들을 전부 다 간소화시킬 수 있는 거죠 완전히 없애지 못하지만 그래서
4:18
대학교 리포트 대필 같은 경우도 하나의 과제 사무 형식으로 학생들의 어떤 수고로움을 필요로 하는 것인데
4:25
그런 것들을 덜어줄 수 있는 것이죠 하지만 그런 것들이 그냥 대필로 제출되는 것은 표절의 시비가 있기
4:31
때문에 대피를 하더라도 무 사무 용도로 요약을 하더라도 본인의 언어로 혹은 본인의 그런 주관적인 의견이
4:37
들어가는 것이 좋다는 생각입니다 기존에 있던 책보 같은 경우에는 단순 검색의 기능에 진하지 않았습니다
4:43
우리가 어떤 것에 대해 물어보면 그것에 대해서만 답변을 해 줄 수 있는 기능밖에 탑재하지 않았는데요
4:49
최지 PT 같은 경우에는 우리가 원하는 답변을 우리가 알맞게 형식화 같이 제공받을 수 있다는 것입니다
4:55
영극 대본으로 알려 줘 하면 영극 대본을 직접 작성해 주고 프로그램 언어로 알려 줘 하면 언어를 직접
5:01
작성해 주기 때문에 우리가 원하는 작업 효율성이 높아진다는데 그 혁신이 있는 거 같습니다 시청해 주셔서
5:08
[음악]
5:18
감사합니다 안녕하세요 서울대학교 기계공학부 박사 과정의 제학 중인 김동욱입니다 오늘은 최치 비티의
5:25
a2g 즉 초보자들도 쉽게 따라할 수 있는 최치 BT 사용 에 대해서 알려 드리도록
5:35
하겠습니다 우선 최지 피티를 굉장히 많이들 요즘 사용하고 계신다고 했는데
5:40
어떻게 사용하는 가라고 궁금해하실 분들이 많은데요 처치 피티는 우선 구글 구글에 지시는게 빠릅니다 말
5:46
그대로 최치 피티를 영어로 이렇게 입력을 해 주시면 됩니다 입력을 하면 많은 결과들이 보이는데요 그중에
5:52
보통은 가장 맨 위에 있어요 이렇게 링크가 되는 처치 피티를 누르게 되면 이렇게 분홍색으로 된 사이트가 뜹니다
5:59
이거 이제 버전에 따라 좀 바뀔 수도 있는데요 오픈 AI 처치 BT고 뜨면 여기 밑에 트라이 처치 BT고 있어요
6:06
이걸 누르게 되면 로그인 창이 뜹니다 여러분들이 구글 계정이 있으시면 구글 계정으로 로그인을 하면 로그인이 바로
6:13
이루어집니다 그래서 로그인을 하고 나면 검은색 페이지 혹은 흰색 페이지가 뜨게 되는데요 눈이 보시자면
6:19
여기 다크 모드를 누르셔서 색깔을 바꿀 수도 있습니다 그런데 기본적으로는 아마 여러분들의 컴퓨터
6:25
색깔에 맞춰져 있을 겁니다 다크 모드를 쓰시면 다크 모드로 시작이 되고 왼쪽에 보시면 여기 뉴 채팅 해
6:31
가지고 있어요 뉴 챗을 누르면 처 BT고 해서 뜹니다 그래서 여기 뭐 example 있고 리테이션 있고 다
6:38
영어로 되어 있는데요 아무거나 하면 입력을 해 볼게요 밑에 보이시는이 창에 입력을 하고 엔터를 누르면 바로
6:44
처치 PT게 흔히말하는 체포 럼 입력을 할 수 있는 겁니다 어 한국어로 인사를 해 볼게요
6:49
안녕하세요라고 하면 좀 시간이 걸리시면 답변을 줍니다 이게 시간이 걸린 이유는 지금 설명을 드릴게요
6:56
한국어보다 영어가 빠른데요 우선 그 이유는 영어 어가 기본적으로 굉장히
7:01
많은 데이터 학습이 돼 있고 한국어는 굉장히 좀 조금 돼 있어요 그래서 여러분들이 빠른 답변을 원하신다면
7:07
한국어보다 영어로 이렇게 헬로 치는게 답변이 빠릅니다 답변 속도가 빠르게
7:12
이렇게 답변 빠르고 주의할 점이 있다면 여러분들이 밤 10시에서 새벽
7:18
3시 정도까지는 웬만하면 사용을 자제해 주세요 아니면 사용을 아예 못 할 수도 있습니다 왜냐면 그 시간대가
7:25
유럽 사람들 영미권 사람들이 주로 사용하는 시간요 트래픽이 터지기 때문에 여러분들이 로그인 자체를 못
7:31
할 수도 있어요 들어가면 많은 사용자들이 사용하고 있기 때문에 사용 못해요 죄송합니다라는 문구가 뜹니다
7:37
그래서 어 보통 낮시간대 우리 한국시간 기준으로 낮시간대 사용을 권장을 드리고 기본적으로 아무거나
7:43
그냥 입력을 해봐도 돼요음 제가 한번 입력을 해 볼게요 피트에게 본인에 대해 설명해 주세요라고 해
7:52
볼게요라고 입력을 해보면 자기 자신에 대해서 설명해 줍니다 피티가 어떤
7:58
거다라고 설명 설을 해줘요 이런 식으로 그래서 어 한 번에 다
8:04
나오지가 않고 단어가 나오는데 좀 시간이 걸려요 그 이유가지 PT 단어를 하나하나 생성을 계속 해
8:10
나가기 때문인데요 그래서 시간은 좀 걸리지만 완벽하게 답변을 해 줍니다음 주의할 점은이 최 PT 3.5 모델은
8:18
2021년까지의 자료만 학습이 돼 있어요 그래서 뭘 물어보더라도 21년 이후의 데이터는 물어보더라도 잘
8:25
모릅니다 날씨 한번 물어볼게요 하에스
8:34
그 이렇게 물어보면 서울 날씨를
8:41
알려주겠죠 날씨는 안 되네 이거 뭐 단순한 검색도 좋지만 조금 심층적인
8:47
답변을 원할 수도 있으면 그거에 대한 맞게 지문을 심층적으로 하면 됩니다 예를 들어서 요즘은 그 주식 시장에
8:54
대한 관심이 많이 사그러들었지만 제가 궁금한게 하나 있어요 테슬라가 왜 이렇게 올라가지 않고 옆으로 기고
9:01
있느냐이 물어볼게요 근데 영어로 물어봐야 돼요 영어로 물어보는게 빠릅니다 그래서 테슬라 슬에 대해서
9:07
좀 심층적으로 분석을 해 달라 우 애가 올라가지 않느냐라고 질문 한번 해 볼게요 질문하면 우선 피트의
9:16
특징은 본인 생각을 이야기할 수가 없어요 얘는 인공지능이 때문에 주어진 자료를 해석해서 우리한테 전달을
9:23
내줍니다 그래서 인공지능이 내놓는 답변은 절대 자기 생각이 들어가지
9:30
않습니다 그래서 앞에 여기 처음에 전 AI 모델이라고 나오는 것이 그거예요 나는 정보만 제공해 줄 뿐이지 이게
9:38
투자에 대한 권유가 될 수 없다라고 이게 그 광고 하듯이 문구가 단 나옵니다 이러한 사람의 영향을 미칠
9:45
수 있는 것들은 다 앞에 이렇게 믿지 말아라고 나옵니다 밑에 보시면은 테슬라가 왜 못 올라가고 있느냐 첫
9:52
번째 이유 경쟁 때문에 두 번째 이유 물가 때문에 그리고 급 때문에네 번째 리스크
10:01
때문에 이렇게 다 분석을 해 줘요 어 거의 신문 기사처럼 나오거든요 그래서
10:07
이러한 어 심층적인 분석도 가능하다입니다 그래서 여러분들이 조금
10:14
더 구체적인 답변을 얻고 싶다면 거기에 대한 조건을 좀 넣어 주면 돼요 왜 얘네가 올라가고 있지
10:19
않느냐라는 것을 뭐 오너 이슈 때문에 오너 이슈 중점으로 해석해 달라 하면
10:27
expin 어
10:39
해주면네 여기 보시면 답변이 나옵니다 답변이 나오는데 알다시피 제가 아까
10:45
말했다시피 2021년까지의 데이터만 학습이 돼 있어요 그래서도 답변을 하네요
10:52
2021년까지의 데이터를 추정 데이터를 모으면 그러면 일론머스크의
10:58
이런 행동들 어떤 영향을 미쳤다 그런데 조금 문제가 있는게 뭐 트위터
11:03
문제 뭐 이런 것들이 있다라고 다 이렇게 심층적으로 분석을 해줍니다 굉장히
11:08
놀라워요 기본적으로 얘가 인공 지능을 갖고 있는 건 아니고 이러한 것들을
11:13
사람들이 많이 검색을 해 봤겠죠 그러니까 거기에 대한 신문 기사 칼럼 이런 것들이 있으니까 거기에 대어
11:19
있는 정보를 갖고 와서 우리가 알기 쉽게 정리를 해주는 거예요 이런
11:25
식으로 작동을 한다고 보면 됩니다 세한 답을 얻고 싶다면 구체적으로 조건은 넣으면 됩니다음
11:32
여기 문제를 주고 But I want to know about 하고 이렇게 좀 조건을 달아 준다든지 이런 식으로
11:38
하면 좋고 기본적으로이 GPT 자체가 문장과 문장단위 단위로 보고 단어와
11:44
단어 다이로 보기 때문에 문장과 문장 한 문장 안에는 같은 주제 넣으시면
11:49
되도록 좋습니다 짬뽕하세 아는데 좀 시간이 오래 걸리고 그리고 우리가 좀
11:54
축약어를 많이 쓰잖아요 근데 축약어가 이니셜이 같은데 다른 단어인 경우가 많아요 그런 경우에는이 AI 최지
12:02
PT 한 번에 구분은 못 하기 때문에 축약어 같은 경우는 다 풀어서 써주시는게 하나의 팁이라고 볼 수
12:07
있습니다 그리고 여기서 또 하나 알려 드릴게요 너무 길잖아요 지금 문단이네
12:13
개예요네 갠데 좀 요약해 달라고 요청도 할 수 있어요 그럼 일단 칭찬을 해 줘야겠죠 그레이 하고 하면
12:19
또 감 고맙다고 하거든요 그 해 놓고 투롱
12:26
드 자 지금 뭐라고 아 너무 길어 세 문장으로 요약해
12:31
줘라고 제가 숫자를 언급을 해줬어요 그러면 세 문장으로 요약을 해주는지
12:36
봅시다 지금 나오고 있는데네 딱 세 문장 있네요 한 문장 두 문장 세
12:43
문장네 마지막 문장이 좀 개긴 한데 문장을 맞추려고 그래도 이렇게 요약을
12:48
해줍니다음네 요약한 능력도 뛰어나다고 볼 수 있네요 그래서 여러분들이
12:53
요약한 거 가지고 뭐 간단히 글도 써볼 수 있겠죠 이렇게 해서 러분
12:58
들이 원하는 조건에 다 따라서도 맞춰주는게 피티의 특징이라고 볼 수
13:04
있습니다 오늘 지금 제가 알려드린 거는 피티의 완전 기초적인 그런 기능들이 뭐 물어보고 대답 없고
13:12
그리고 거기서 조건에게 요약하고 이러한 것들을 지피에 아주 기초적인 기능이라고 할 수 있고 여러분들이 잘
13:18
활용하셨으면 [음악] [박수]
13:27
좋겠습니다 네 안녕하세요 요즘 개강도 했고 해
13:34
가지고 슬슬 과제라는 팀플이든지 발표 준비 같은 거 많이 하실 텐데요 주제가 좀 막막한 경우에 간단하게
13:41
발표 주제 자료를 찾고 어떻게 하면 준비를 할 수 있는지 최 피트를 활용해서 저희가 보여 드리려고
13:51
합니다 뭐 여러분들 이제 최지 PT 많이들 사용하셨다 피 이렇게 들어가시면 여러분들이 바로 로그인
13:58
요청 그다음에 새로운 채팅을 할 수 있게 이렇게 뜰 거예요 화면이 여기서 이제 뭐 팀플 주제 같은 거 잡아
14:04
가지고 발표 준비도 하고 자료도 만들고 스크립트 써야 되고 이런 것들이 많은데 제가 옛날에 했던 팀플
14:11
주제로 한번 예시를 들어 보려고 해요 시간여행에 관련된 팀플이 있었어요 과학이라는 철학이라는 비교해서
14:17
발표해라 아는 주제가 있었는데 상당히 막막했던 주제였습니다 배경 지식부터 좀 물어보고 발표 준비를 도움을 최지
14:24
피트에게 요청을 해 보려고 하는데요 가장 쉬운게 영어로 질문해 보는 겁니다 한국어 질문을 하면 답변이 좀
14:30
안 돼요 그래가지고 영어로 제가 부득이하게 좀 작성을 해 보겠습니다 내가음 시간 여행에 대한 짧은
14:37
스피치를 해야 되는데이 주제가 현대 물리학과 관련이 있었으면 좋겠다라서 제가 지금 창에다 쳤어요 처음부터 막
14:44
다 해 달라라고 하면 피티가 너무 많은 거 한 번에 쏟아낼 가능성도 있어서 차근차근 하나씩 요청을 하셔야
14:50
됩니다 처음에 제가 요청할 것은 온라인 개요부터 좀 짜 줘라 약간의 이론적인 기본 배경이 들어가도록 짜
14:57
달라라고 했어요 그리고 여기서 중요한 거는 조건문을 자세하게 넣어 줄수록 좀 원하는 답변을 얻을 가능성이
15:03
커집니다음 지식 수준까지 한번 넣어 볼게요 나와 청중들이 수준이 어느 정도다 대학 물약 정도는 다들 이해를
15:10
한다라고 이제 한번 보내 보겠습니다 그러면 개울을 짜 주는데 지금 아웃라인을 짜 주고 있고 첫 번째로
15:16
시간 지원과 관련된 얘기가 나오네요 뭐 아인슈타인 상대성 이론 이런 좀 전문적인 용어도 나옵니다 두 번째
15:22
쌍둥이 역설 세 번째 웜홀네 번째 커티 그다음에 다섯 번째 어 이상한
15:27
개념도 나오네 다음으로 해볼 거는 그러면이 다섯 개를 내가 발표에 직접 써도 되는지 물어볼게요 이렇게 집한테
15:34
고마워라고 해주면 또 좋아합니다 좋아하진 않고 그냥 조금 더 대화하듯이 이거 그냥 프리젠테이션에
15:40
다섯 개다 써도 되나요 근데 이렇게 발표하기는 조금 따분 하니까 이거를 그대로 사용하되 이목을 끌 만한 예시
15:47
같은게 있는지 훅이 있는지 같이 좀 요청을 해 볼게요 그러면 또 답변을 줍니다 서론은 어떻게 시작하면
15:54
되고부터 다 주고 있습니다 서론에서는 훅을 하나 넣으라고 하네요 청중을 사로 잡을 수 있는 훅을 넣고
16:01
재미있게 봤던 영화라지만 영화들을 넣으면 좋겠다고 나오고 이게 보면
16:06
비전공자 입장에서는 참 어려운 개념들이 많이 나옵니다 뭐 쌍둥이 역설 원물 이런 건 들어봤어도 밑에
16:12
나오는 노비 코프의 자기 일관성 추측 이런 거 나오는데 이제 이제 한국어로 제 지역을 한 겁니다 그래서 이런
16:19
것들은 우리가 처음 보는 거잖아요 그러면 여기서부터 계속해서 구체적으로 하나씩 물어가 보면 됩니다 쇼지
16:25
피티가 다른 일반적인 구글보다 좋은게 내가 과거에 물어봤던 거 그리고 답변 받았던 거에이어서 꼬리를 불고
16:31
계속해서 답변을 받을 수 있다는 거예요 어 노비 코프의 자기 일관성 추측이 뭔지 이렇게 나오고 있습니다
16:38
영어를 바로 읽으실 수 있 있으신 분은 그냥 읽어도 되는데 만약에 좀 어렵다 싶으면 여기 나오는이 답변들
16:44
있잖아요 이거 아래 문장들을 한국어로 번역해 주세요 하고 넣으면 됩니다
16:51
그러면 이렇게 한 다섯 문단 정도 되는 것이 다 한국어로 번역이 됩니다
16:56
그래서 이런 식으로 다 넘어가죠 이론에 대해서 더 알고 싶으면 논문 추천해 달라 유튜브 추천해 달라 이런
17:02
식으로 나올 수도 있는 것이죠 스크립트를 써 달라 하면 스크립트를 써 주기도 합니다 하지만 스크립트는
17:08
써진 대로 읽다 보면은 오류가 발견될 수도 있기 때문에 스크립트를 써 달라 하고 보통 이렇게 수정하는 것을
17:14
권장을 드립니다 그래서 제가 한번 스크립트를 써 달라고 요청을 하겠습니다 3분짜리 스크립트를 써
17:21
달라고 제가 좀 요청을 드렸고 여기 채치 PT 그래서 인트로덕션부터 Hello everyone today
17:26
going to talk time TR 해 가지고 쭉 나오게 됩니다 이런 식으로 팀플 과제 스크립트 짜는
17:32
것까지 기본적으로 해봤는데 물론 이렇게 단기간에 될 순 없죠 여러분들이 조금 더 많은 서칭과
17:38
그리고 좀 더 다양한 질문들을 초집 피하게 해야 되겠지만 가장 중요한 것은 여러분들이 꼬리에 꼬리를 물고
17:44
질문을 하면 더더욱 좋은 답변을 내놓는다는 것과 글를 읽고 제대로 이해했는지 물어볼 수도 있어요 내가
17:51
이렇게 이해한 것이 맞니라고 하면 예스 or 노 하면서 다시 알려줍니다 여러분들이 이런 기능들을 활용하셔서
17:57
팀플 혹은 과제에 사용하셨으면 좋겠습니다 솔직히 팀플 한 명이 다
18:02
알아서 할 수 있죠 친구가 거의 세네명 역할을 한 번에 할 수 [박수]
18:18
있으니까네 안녕하세요 여러분들이 대학원 같은데 지원할 때 보통 이공개
18:23
대학원의 경우 연구 계획서를 쓰도록 되어 있습니다 연구 계획서를 쓸 때 대부분 의 지원자분들이 많이
18:29
당황하네요 처음 써보는 것이기도 하고 할 줄 아는게 없는데 어떻게 연구 계획서를 써야 하느냐라는 좀 이렇게
18:35
궁금해 하신 분들이 많은데 철치 피티를 활용해서 어떻게 하면 연구 계획서를 쓸 수 있는지 그리고 도움을
18:41
얻을 수 있는지 한번 살펴보도록
18:47
하겠습니다 처치 PT 사이트를 켜고 지금 로그인도 한 상태입니다 우선은 여러분들이 지원하려는 대학원 분야가
18:55
있겠죠 저 같은 경우는 뭐 데이터 사이언스 AI 대학원 예시로 한번 들어보겠습니다 우선 연구 계획서를
19:01
쓰려면 지금 내가 어떤 주제를 하나 잡아야 돼요 주제를 잡아야 되고 그 주제가 트렌드에도 맞아야 되고 그고
19:08
좀 연구할 만한 분야가 있어야 됩니다 그래서 한번 물어볼게요 지금 그냥 단순하게
19:14
물어봤어요 처음부터 많은 걸 요청할 필요 없이 그냥 여러분들이 처음 만난 사람이랑 대화하듯이 물어보면 됩니다
19:21
내가 지금 AI 대학원 직원을 준비하고 있는데 요즘 핫한 픽들 좀 알려 달라 하면 되게 많이 알려주네요
19:28
이렇게 이제 간단한 질문을 했는데도 정말 많이 알려줍니다 딥러닝 강화 학습 nlp 자연어 처리 컴퓨터 비전
19:36
베이지안 뭐 등등 많이 알려주고 있습니다 여기서 제가 하나의 타픽 집어 가지고 계속 한번 해 볼게요
19:42
익스플레인 AI 걸 해 볼게요이 익스플레인 러버 AI 조금 자세히 알려 달라고 또 적어봤습니다이 xai
19:50
어쩌고저쩌고가 있다 그래서 다양한 방법들이 나오게 되네요 로베이스 메
19:55
라임도 나오고 샵도 나오고 이런 다양한 방법들 들이 나오게 되고 여기서 연구 계획서를 여러분들이 쓸
20:01
때 중요한 거는이 연구들 다 조금 더 낮거나 혹은이 연구들의 한계를
20:07
극복한다는 이런 부분들이 들어가야 됩니다 그래서 좀 물어볼게요 제가 실시간으로 바로 치는 거라 영어
20:12
문법은 좀 안맞을 수 있는데 어떻게 물어봤냐 알려준 방법들 알려준 알고리즘들 중에 좀 내가 새로 도전해
20:19
볼 만한 거 혹은 보안이 필요한 알고리즘들이 있을까라고 물어봤을 때 여기에 다양한 방법들이 또 나옵니다
20:25
그래서 여러분들이 연구 계획서를 쓸 때는 이들 중에 하나를 골라서 거기에 맞게 집중적으로 여러분들이 만들어
20:32
내시 되는 거예요 사실 영국의 엑서 대학원
20:44
입학용병 잡아 볼게요 스앤 마이어스 그래서 최종적으로 제가 물어보겠습니다
20:49
한번 물어봤습니다 그래서 여기서 4번 네스 앤 바이어스에 관련해서 내가
20:54
연구 프로포절을 작성해야 되는데 500달러 이내로 작성을 해 달라 하면 이렇게 작성해 줍니다 제목도
21:01
정해졌네요 무슨 내용인지 아시고 작성을 해야 돼요 여기서 무대고 묵부 하시면 안 되고 그래서 러닝에서 이사
21:07
결정을 할 때 데이터 세세에 있는 뭐 바이어스 같은 거를 되게 좀 분석을 하고 조사를 해 보자라는 것으로
21:13
이렇게 스트가 나왔습니다 여러분들이 이것을 보고 그대로 복붙을 하면 안 됩니다 이들 중에 말이 안 되는
21:20
부분들을 속아 내셔야 돼요 왜냐하면 그냥 문장이 말이 되면 써 버리기 때문에 칠린 부분이 있다면 여러분들이
21:27
모여야 됩니다 여기 머리까지 스트에 맞게 적혀 있는지 봐야 됩니다 그래서 다 됐다고 생각이 되면 또도 너무
21:34
길게 된 너무 길다고 생각하면 또 요약을 시켜야겠죠 고마워 하고 500단어 리를 좀 길다 100단어
21:41
내로 요약해 달라 하면 또 100단어 내로 요약을 해 줍니다 그리고 보통
21:47
런데 키워드까지 적게 돼 있거든요 그래서 키워드를 세 개만 정해 달라고 했습니다 fair
21:53
bth 이렇게 나와 있네요 이런 식으로 여러분들이 간단하게 적어볼 수
21:58
있고 여러분들이 만약에 적다가 영어로 기억이 안 나는 단어들이 있을 수 있어요 그러면 한국어로 적어도 됩니다
22:04
예를 들어서 입학 지원서가 영어로 뭔지 기억이 안 난다 그러면 중간에 이런 것들 한국어 단어로 써도 이런
22:11
식으로 나오게 됩니다가 알아서 이해를 하고 해석을 해 줍니다 이런 식으로 연국 엑서 같은 것도 작성을 해
22:17
봤습니다 연국 서를 작성할 때 주의하셔야 될게 결국에는이 내용들이 어딘가에서 사용되었을 수 있어요
22:24
사용된 것의 조각일 수 있기 때문에 반드시 한번 프레 곧 여러분들의 단어로 고쳐야 됩니다 물론 생성된
22:31
결과를 표절 안 걸리게 다시 패러프레이즈 해 줘라면 해 주긴 하는데 그래도 어 연구 윤리 관점으로
22:37
볼 때 여러분들이 다시 한번 여러분들의 언어로 수정시키는 것을 권장드리고 GPT 언제까지나
22:44
참고용으로 가이드라인 용으로 사용하시길 부탁드리겠습니다 표절이라는 단어가 쵸
22:51
PT 나오면서 되게 모호해지기 했는데 그래도 자신만의 언어로 작성해 본다는게 연구 계획수 작성에는 의의가
22:57
있을 것 같습니다 [음악]
23:10
네 안녕하세요 여러분들 오늘은 화면에 보이시는 것처럼 GPT 기반 언어 모델의 특징 간략하게 한번 요약해
23:17
보도록 하겠습니다 여러분들이 쓰고 있는 어 최 GPT 어떤 원리로 동작이 되고 또 그 안에서 주의의
23:23
할점 그리고 그 주의의 할 점을 지키지 않았을 때 어떤 문제점이 발생할 수 있는지 이렇게 언급을 하고
23:30
그리고 마무리를 하려고 합니다 GPT 기반 언어 모델 굉장히 많은 리소스들이 나오게 되는데 간단하게
23:36
그냥이 한 페이지로 요약이 가능해요이 세 가지 과정만 이해하시면 별다른 긴
23:41
영상 보실 필요 없이 대부분 요약이 되실 겁니다 첫 번째 스텝은 데이터를 얻어서 초기에 학습을 하는 것 그리고
23:48
두 번째는 리워드 모델 정하는 것 세 번째는 그 리워드 모델을 통해서 강화
23:53
학습을 시킨다 이렇게 그림으로 보면 좀 이해가 안 가실 수 있으니까 어 스텝 1에 대해서부터 한 자세히 한번
23:59
볼게요 스텝 1 같은 경우에는 언어형식 해야 돼요 그런데 컴퓨터는
24:06
언어를 숫자로 이해합니다 결국 우리 언어에 갖고 있는 감정이라는 이런 거를 결국엔 다 기계적으로 학습을 할
24:12
수밖에 없어요 그림에 보이시는 가장 간단한 구조인 프리 트레이닝과 파인튜닝 두 가지로 진행이 됩니다
24:19
프리트레이닝 같은 경우는 여기 이미지에 제가 간단한 예시를 가져왔어요 예를 들어서 제가 지금 말을 하고 있잖아요 말을 할 때
24:25
여러분들이 들리는 것에 어색하지 않을 거예요 왜냐면 단어와 단어 사이 문장과 문장 사이가 다 이렇게
24:32
자연스럽게 연결이 되잖아요 그래서 0 지금제 영어 문장으로 예시를 드러났는데 ello My
24:37
Name이라는 세 개의 단어를 제가 입력으로 한번 줬어요 컴퓨터에게 그러면이 컴퓨터는 그다음 단어를
24:44
예측하는 겁니다이라는 단어를 예측하는 거예요 그런데 초기에는 뭐 아무것도 모르니까 그래서이라는 정답을
24:50
알려줍니다 Hello My name 다음에는이가 보통 오더라 해서이를 정답으로 알려 주는 거예요 구글에 뭐
24:55
네이버에 다음에 이런 포털 사이트 등 에이 글로된 문서들을 전부 다 여기에 다음으로 올 단어를 예측한다는 것으로
25:03
학습을 시키는 겁니다 당연히 대규모의 데이터셋이 필요하고 또 리소스도 필요하겠죠 이거를 지금 오픈 AI에서
25:09
GPT 모델에 학습을 시킨 거고 그리고 이렇게 다음 단어로 올 예측 과제를 수행을 하면 그다음에 다음으로
25:16
올 단어 그리고 분류 문제 그리고 유사도 문제과 같이 세부적인 문제로 파인 튜닝이라는 걸 시킵니다 이거는
25:23
트랜스포머 구조를 사용하는 것인데 트랜스포머 구조는 기본적으로 자연어 우리가 말하는이 언어를 컴퓨터가
25:30
이해하기 쉽게 숫자 형태로 바꿔 주고 그 안에서 처리하는 처리 모델이라고 보시면 됩니다 그러면이 스텝 1을
25:36
거치게 되면 컴퓨터가 어떤 상태가 되느냐 인공지능이 다음 단어로 올 예측은 정말 잘하게 됩니다 이렇게
25:43
영어 문장을 주면 다음에 올 문장 레벨 단어 레벨을 상당히 예측을 잘하게 돼요 여기서 그런 예측 문제만
25:50
해결을 하게 되면 발생하는 한계점 아쉬운 점이 다양한 대답을 못 내놓는다는 것이고 보다 나은 대답을
25:57
놓지 못한다라는 그런 아쉬움이 있을 거예요 예를 들어서 제가 여기 리워드 셰이핑라는 여기 슬라이드가 있는데
26:04
제가 최지 PT한테 항공권을 예약하는 방법에 대해 알려 주세요라고 물어봤어요 그러면 GPT 대답을 내
26:10
놓겠죠 이렇게 세 가지의 대답을 내놓는다고 해 볼게요 이들 중에 우리가 보기에 조금 더 좋아 보이는
26:16
대답이 있죠 사용자가 원하는 대답 원하지 않는 대답 선호한 대답 좀 레이블링이 필요합니다 그래서이 오픈
26:22
AI ES 어떤 방법을 썼냐면 사람을 고용해 가지고 GPT게 똑같은 걸 물어보고 여러 가지 대답을 넣잖아요
26:28
어떤 대답이 좋다 어떤 대답이 별로다라고 순위를 매기게 합니다 그렇기 때문에 엄청난 인건비도 들었을
26:34
거예요 그런데 이걸 다 했고 그래서 리워드 모델이라는 걸 만들게 돼요 리워드 모델이라는 걸 만들어서 GPT
26:41
똑같은 질문에 대해 여러 대답을 내놨을 때 순위를 매깁니다이 순위를 토대로 사람이 조금 더 마음에
26:47
들어하는 그런 대답에 대해서 우선 순위를 갖도록 GPT 학습을 시킬 수
26:52
있게 되는 것이고 그게 이제 스텝 3에서 하는 R reforce 러닝이라는 거예요 GPT 같은
26:58
경우에는 ppo 아는 알고리즘을 썼는데이 알고리즘 역시 강화 학습에서는 굉장히 자주 쓰이는
27:04
알고리즘 중에 하나입니다 쉽게 설명드리자면 여기서 우리가 앞에서 구한 리워드 모델이 있고 리워드
27:09
모델이 결국엔 점수예상 주고 3번에 2점을 주고 2번에 1점을 줬다 하면이 점수를
27:17
토대로 다른 프론트에 동일하게 적용을 해서 사람이 조금 더 좋아하도록 거부가 없이 느끼도록 학습을 진행한다
27:24
해가지고 결국에는 그냥 인터넷에서 떠돌다 수수많은 문서들을 마이 되게끔
27:30
대답을 내놓는 그런 학습 모델에서부터 사람이 조금 더 거부감이 없는 모델로
27:35
진화하도록 하는게이 스텝 3까지의 과정입니다 그럼에도 프리 트레에서 오는 한계가 좀 있어요 대규모의 문장
27:42
단위를 예측으로 학습하기 때문에 그리고 결국에는 사람이 레이블링 하는 거에도 한계가 있어요 그렇기 때문에
27:49
GPT 문맥상 어색하지 않으면 그러니까 사람이 느끼기에 문맥상 어색하지 않으면 학습이 잘 되었다고
27:55
판단이 하고 그냥 프롬트 풋으로 내보냅니다 그렇기 때문에 GPT 생성한 결과에이 진니 여부가 확인이
28:02
불가능해요 그래서 제가 예시를 하나 보여 드릴 텐데이 GPT 제가 한번 입력을 해 보겠습니다 뭐라고 입력을
28:08
해 봤냐는 논문을 좀 찾아보려고 해요 그래서 미분 기하에 대한 괴상한 분야기 한데 최신 논문을 알고 싶다
28:15
그렇기 때문에 최신 논문을 좀 정리해 줄 수 있겠느냐 제가 금 최지 피티에 물어봤어요 그랬더니 다섯 개의 논문을
28:22
잘 정리해 줬습니다 심지어 제가 제자 이름 제목 순서도 정리해 달라 했는데 그것도 다 맞춰줬어요 그런데이 논문이
28:29
실제로 있나 찾아봤어요 검색을 해 봤는데 없습니다 이렇게 특히 논문 검색의 GPT 굉장히 취약해요 말이
28:35
되는 거 같으니까 생성을 한 겁니다 그런데 실제로 찾아보면 없는 논문을 이렇게 막 생성을 해냅니다 그렇기
28:41
때문에 여러분들이 꼭 GPT 이용해서 뭔가를 할 때 지니 어부를 확인을 하셔야 됩니다 보고서라는 작성을 하실
28:48
때 우선 GPT 도움을 받고 그 안에 있는 내용 하나 하나는 아직까지는 수작업으로 확인을 하셔야 잘못된
28:55
정보를 전달하는 일은 없을 것입니다 잘못된 정보 전달이 올 수 있는 이유는 프리트레이닝 모델을 사용하기
29:02
때문이고 프리 트레이닝은 인터넷에서 돌아다니는 수많은 문서들 이용해서 학습을 하는 것이기 때문에 그중에
29:08
잘못된 정보도 있을 것이고 사람의 편견이 들어간 정보도 분명히 있을 거예요 그렇기 때문에 아직까지는
29:13
GPT 활용할 때 조심을 하셔야 된다는 겁니다 간단하게 GPT 언어 모델 요약하자면 세 개의 스텝으로
29:20
이루어져 있고 첫 번째 스텝에서 프리트레이닝 이용하기 때문에 진위 여부에 대해서는 조금 조심하셔야
29:26
된다라는 부분 분으로 오늘 이렇게 설명 마치도록 하겠습니다
29:32
[박수] [음악]
29:42
감사합니다 바디에도 해보고 채집 비에도 해볼 때 뭐 거의 막상 막하고 쓰기 나름인 거 같아요 그런데 지금
29:50
출력 결과가 뭔가 좀 이상하죠 [음악]
29:55
그죠네 안녕하세요 세요 이번 영상에서는 처치 PT 대항마로 떠오르고 있는 바드에 대해서 좀
30:02
살펴볼 건데요 특징 그리고 사용법 간단하게 알려 드리고 똑같은 질문을 바에도 해보고 최지 비에도 해 볼 때
30:09
어떻게 다른지 좀 살펴보도록 하겠습니다 그래서 바드 자체가 구글에서 만든 거기 때문에 구글에다가
30:15
그냥 .google.com 이렇게 치면 바드 페이지가 바로 나오게 됩니다 참고로 바드는 지금 실험 베타
30:22
버전이에요 그렇기 때문에 아직 정식으로 출신 되지 않았는데 그럼에도 지금 로그인만 하면 이렇게 프롬프트가
30:28
나오고 입력을 할 수 있습니다 기본적으로 채지 피트라 똑같이 생겼어요 명령 프롬프트에 여러분들
30:34
뭔가 입력할 수 있게 돼 있거든요 뭔가를 한번 입력을 해 보죠 그냥 진짜 인사 한번 해 볼게요 헬로 해 볼게요 피에도 똑같이 헬로 해볼게요
30:42
똑같은 답변 나오죠 여기서 바드만이 갖고 있는 특징 중에 하나 다른 답안 보기라는게 있어요 보시면은 답안 1
30:48
답안 2 이렇게 있거든요 약간 다른 언어 모델을 사용하든지 파라미터를 약간 조작하는 거긴 한데 이렇게
30:54
다양한 답안을 얻을 수 있다라는 아주 작은 차이점이 있어요 조금 고급진
31:00
거를 한번 물어볼게요 자 내가 어떤 수학 분야에 대해서 공부를 하고 싶은데 어떻게 시작을 하면 될까요
31:06
영어로 물어봤습니다 똑같이 GPT 게도 물어봤습니다네 이런 식으로 바드가 답변을 내놓았고 GPT 답변을
31:15
내놓고 있습니다 여기서 보시면 GPT 다 바드가 조금 더 빠릅니다 최소화가
31:20
좀 잘 돼 있고 GPT 조금 느리긴 하지만 그래도 이렇게 답변을 내 놓는 모습이에요 이게 사용 자 순간 접속자
31:28
수 차이에서도 발생할 수 있는 문제라 속도 같은 경우에는 크게 신경을 쓰지 않으셔도 될 거 같고 역시나 다른
31:34
답안도 가능하다라는 것입니다 그래서 내놓는 답변들은 비슷해요 텍스트북 하고 뭐 온라인 리소스 있다 여기도
31:42
터디 텍스트북 있고 이런 것들이 있다 여기는 키워드 개념 위주로 알려줬네요 그래서 비슷해 보인다라는 것입니다
31:49
와드에서 조금 더 제가 장점이라고 생각하는 거는 한국어 최적화 있는데요 자 이렇게 한국어로 그냥 지금 아무
31:57
거나 물어봤습니다 이렇게 답안을 내놨네요 여기 같은 경우는 짧게 지금 답안을 내놨고 바드 같은 경우는 거의
32:04
위키 수준으로 답을 내놨습니다 한국어 최적화라는 이유가 구글 같은 경우에는 그래도 나와 있는 한국어 문서들이
32:11
많아요 하지만 GPT 오픈 a 같은 경우는 한국어로 학습된게 굉장히 적습니다 그렇기 때문에 한국어로
32:17
여러분들이 주고받을 때는 어쩔 수 없이 바드가 조금 더 속도가 빠를 수밖에 없어요 그래서 지금 보시면
32:24
내놓는 답변도 GPT 조금 짧아요 그렇기 때문에 한국어로 하시는게 편하다 하면 바드를
32:31
추천드립니다 지금 여기 보시면 마음에 들어요 마음에 들지 않아요 이거 있는데 실험 버전이라서 이런 답변들에
32:38
다 레이블을 할 수 있도록 하는 거 같아요 바드를 사용할 때는 한국어로 물어봐도 무방하다는 것입니다
32:45
마지막으로 해볼 거는 간단한 코딩 하나만 요청을 해 볼게요 짧은 코딩을 한국어로 피티와 바에게 물어봤습니다
32:52
번 볼까요 이런 식으로 바로 파이썬 코드가 나왔네요 여기도 바로 파이썬 코드가 나왔네요 간단한 코드라서
32:59
GPT 같은 경우는 조금 더 tmi 이렇게 해 주는 모습입니다 코딩 같은 경우도 이런 식으로 잘 된다라는 것을
33:05
여러분들에게 확인을 해 드렸습니다 기본적으로 GPT 럼 사용을 할 수 있고 한국어 추 적화가 더 잘 되어
33:12
있기 때문에 영어에 익숙하지 않으시다면 바드를 사용하는 것을 추천을 드립니다 그리고 최근에 결과를
33:19
보면 아직까지도 뭐 고차원적인 문제 해결 예를 들어서 SAT든지 수능 문제 풀어보는 거 똑같이 GPT
33:26
바드에 물어보면 면 거의 막상 막하 GPT 좋거나 이런 경우도 있는데 결국에는 쓰기 나름인 거 같아요 다만
33:33
한국어는 바드 잘통한다이 정도로 알아주시면 될 거 같습니다 바드에
33:38
채팅 초기하 싶으면 여기 채팅 재설정 누르면 바로 깔끔하게 사라지고 바둑
33:43
활동 내역에 대해서는 여러분들이 이렇게 삭제를 하셔서 개인 정보
33:49
관련한 문제도 좀 해결하시면 좋을 것 같습니다네 이렇게 간단하게 살펴봤고
33:54
운성 인식 기능도 있는데 여러분들이 한번 사용을 해 보셨으면 좋겠어요 그래서 바드를 통해서 또 하나 언어
34:01
모델 여러분들이 편리하게 사용을 해 봤으면 좋겠습니다 영상 마치도록
34:18
하겠습니다네 안녕하세요 이번 영상에서는 최치 pt's 개발한 어 GPT 4 모델에 대해서 설명을
34:24
드리려고 하는데요
34:29
최 GPT 사용해 보신 분들은 이렇게 위에 GPT 3.5와 GPT 4라는
34:35
두 개의 카테고리로 생겼다는 것을 확인을 했을 거예요 GPT 3.5는 우리가 무료로 사용할 수 있었는데
34:41
GPT 4 같은 경우는 돈을 내야 됩니다 메뉴에 보시면 마이 플랜이라고 있고지 BT 플러스라는 것이 있습니다
34:48
제가 구독을 해 놓은 상태이고 여러분도 만약에 사용하고 싶으면 플랜 들어가서 결제를 하시면 바로 사용을
34:54
할 수 있습니다 GPD 4에서 세팅스 들어가면 여기 베타 피처 실험 실이라고 하는데 코드 인터프리터
35:01
활성화를 해 주시면 디에서 현재 개발하고 있는 새로운 기능을 체험을 해 볼 수가 있어요 활성화시킨
35:07
상태에서 GPT 4를 누르고 GPT 4를 누른 상태에서 여기 코드 인터프리터에 체크 표시가 나오게 여기
35:14
플러스라는게 생기고 업로드 파일이라는게 생겨요 디폴트에서는 그냥 안녕이라고 보낼 수 있었던 최
35:20
기능에서 벗어나서 새로운 파일을 업로드 할 수 있는 기능이 생겼다는 건데 그래서 어떤 파일을 업로드하고
35:26
이 파일에 대해서 지의 응답을 할 수 있다는 것이죠 제가 예시 데이터를 좀 준비해 봤는데 케이라는 마음대로
35:33
데이터를 다운로드 받을 수 있는 사이트예요 올림픽 데이터를 가져와 봤고 엑셀 파일에 담겨져 있어요 엑셀
35:39
파일을 업로드를 하면 이렇게 파일 자체가 올라갑니다 지금이 파일에서 제가 뭘 하고 싶냐면이 파일에 뭐가
35:46
있느냐 요약해 달라라고 한번 부탁을 해 볼게요 요약만 해 줘라고 하면 작업을 시작합니다 어떤 데이터를 담은
35:53
거구나 아고 바로 설명을 해 줍니다 보시면 이런 식으로 된 데이터이다
35:59
지금 요약을 해 주고 있습니다 여기서 인사이트 같은 걸 원하라 해서 제가 한번 통계적인 분석을 해 달라라고
36:05
했습니다 그러면이 친구가 또 뭔 작업을 시작을 해요 그리고 바로 평균 연령이 그지 최대 최소 나이라는 이런
36:12
거 다 나와요 GPT 4가 뭘 하길래 이런 정보들을 실시간으로 내놓느냐라고
36:17
궁금해하실 분들이 좀 많을 것 같아요 그래서 여기 피니 working 옆에 보면 쇼라고 돼 있죠 뭔가 나타나요
36:24
이게 뭔가 보니 파이썬 코드입니다 결국에는 GPT 4의 베타 버전에서 하는 것들이이 파일을 처리하기 위한
36:30
파이썬 코드를 짜 주고이 파이썬 코드의 실행 결과를 보기 좋게 출력을 해 준다는 거예요 결국에는 엑엑셀
36:37
파일을 넣었을 때 엑셀 파일을 효과적으로 읽고 분석하는 코드를 짜 주는 거예요 단순히 그냥이 결과를
36:44
활용할 것이 아니라 이러한 파이썬 코드들을 여러분들이 전략적으로 활용을 할 수 있다는 것이죠 gpt3 3.5
36:50
기능에서는 이러한 데이터가 있을 때 여기서 내가 서머리 하 하기 위한 코드를 짜 줘라고 했으면 지금은 그냥
36:57
파일 올리고 바로 결과를 볼 수 있다는 장점이 있습니다 엑셀 파일 해
37:02
봤으니까 이번에는 이미지 파일을 한번 해보고 싶은데는 뉴스를 한번가 볼게요네 이렇게 많은 뉴스들이 지금
37:10
떠 있어요이 뉴스 화면을 캡처를 해서 지금 한번 올려 보겠습니다 이미지
37:16
안에 어떤 일이 일어나고 있는지 어떤 내용들이 담겨 있는지 연적을 해 달라라고 했습니다 그러면이 친구가 또
37:22
뭔가 작업을 시작을 하죠 이런 식으로 뭐 뭐가 있다 뭐가 있다 나옵니다 뉴스 내용들을 다 글로서 요약을 해
37:28
줍니다 그래서이 친구가 또 어떤 작업을 했냐 봤더니 이미지에서 어떤 특정한 단어들을 꼽아내는 그래서
37:36
단어들을 다 추출 했죠이 추출한 단어들을 이런 식으로 요약을 해 준 겁니다 그러면 우리나라 뉴스에서도 볼
37:42
수 있지 않을까라고 생각을 해서 제가이 스포츠 화면을 또 캡처를 해서 도전을 해 봤습니다 똑같이 한번
37:49
작업을 요청을 해 볼게요 결과를 놓을 준비를 하고 있습니다 볼까요 여기
37:55
뭐라고 했죠 아 잘 클리어하지 않다라고 나와 있죠이 GPT 아는 거 자체가 사실은 한국어를 잘 인식을 못
38:03
하기도 하지만 리 지금 사용했던이 함수 있잖아요이 함수 자체가 한국어에 대해서 잘 캡처를 하지 못하는
38:10
상황인가 봐요 GPT 자체가 결국에는 파이썬 코드를 출력하고이 파이썬 코드 작업 결과를 내놓는 거기 때문에 함수
38:17
자체가 한국어 지원이 안 되면 사실은 할 수 없어요 그래서 아직은 한국어 데이터 처리에 대해서는 조금 어 되지
38:24
않는 상황입니다 하지만 뭐 영어로 된 데이터에서는 잘 작동을 하기 때문에 여러분들이 그런 데이터 처리에 관심이
38:31
있으시면 한번 적극적으로이 gpt4 기능을 활용을 하시면 좋겠습니다 이렇게 gbt 4에 있는 베타 기능
38:38
파일을 업로드해서이 파일을 처리하는 거를 알아봤고이 이미지의 크기를 한번
38:44
알려 달라고 해 볼게요 이렇게 930 * 903 픽셀이다 나오잖아요 또 뭘
38:49
할 수 있냐면 이미지를 절반으로 압축해 달라고 해 볼게요 다운로드를 한번 해보도록 하겠습니다 정사각형으로
38:55
이미지가 바뀌는 것을 볼 수 있습니다 이렇게 좀 살펴봤고 이미지 같은 것도
39:02
처리를 할 수 있다 물론 직접 처리하는 것은 아니고 파이썬 통해서 처리를 하는 겁니다 그리고
39:07
여러분들이이 파이썬 코드를 직접 활용할 수 있다는 장점도 있고요 hpt 4.5의 베타버전 기능에
39:13
대해서 간단히 알아봤고 영상을 마치도록 [음악] [박수]
39:25
하겠습니다 네 이번 영상에서는 라지 랭귀지
39:31
모델이라는 거를 주제로 이야기를 해보도록 [음악]
39:38
하겠습니다 LM 모델이라는 것이 라지 랭지 모델의 약자인데 대규모 언어를
39:43
다루는 모델입니다 새로운 개념인가고 생각하실 수도 있어요 크게 다를 거는 없고 대규모 모델을 다루고 있다는
39:49
점에서 요즘 트렌디하게 만들고 있는 거 같습니다 라즈 랭지 모델이 뭐니 하고 gbt 테 물어봤더니 방대 대한
39:56
양의 데이터로부터 인간의 언어와 유사한 그런 텍스트를 어 이해하고 그리고 만들어 된다라고 돼 있고 밑에
40:03
줄에 nlp 테스크를 사용한다라고 돼 있습니다 결국에는 제가 이야기하고 있는 한국어부터 시작해 가지고 영어
40:10
혹은 기계어 하나의 언어라고 볼 수 있기 때문에 이러한 언어들을 처리하는 것이 어 랭귀지 모델이고 그 언어들을
40:17
처리할 때 방대한 양의 학습 데이터를 사용했다 혹은 꽤나 많은 양의 리소스를 사용한다 하면 라즈 랭지
40:24
모델이 되는 겁니다 번역이라 혹은 오타를 수정한다는 물어보면 거기에 대한 답을 한다든지 혹은 뭐 요약을
40:31
할 수도 있고 그냥 일반적인 대화를 생성할 수도 있습니다 그런 것들이 다 라즈 랭지 모델의 태스크 중에서
40:38
이루어질 수 있는 것이고요 그래도 nlp llm 대해서 비교는 해 봐야겠죠 거의 같은 개념이지만 llm
40:45
경우는 nlp 한 분야이자 굉장히 큰 데이터 셋만 쓴다라는 것이 차이만
40:51
있다라는 것을 기억해 주시면 될 거 같습니다 그래서 LM이 어떻게 게
40:56
최종적으로 구성이 되어 있는지 한번 제가 외부에서 그림을 가져와 봤는데요 이렇게 라지 랭지 모델이 있고 라지
41:03
랭지 모델에서 어떤 언어 모델을 학습을 할 거예요 언어 모델을 학습을 할 때 주로 인터넷에서 있는 소스들을
41:10
많이 사용합니다 실제로 최치 PT 학습을 할 때 사용한 리소스들이 인터넷에 있는 문서들 뭐 대화들 다
41:18
끌어 모아서 그 구조를 학습한 거예요 그래서이 노리지
41:23
리스라시르의 합니다 지금 여기 1번 보시면 프롬트 쿼리는 처지 피라고
41:28
한다면 제가 아까 러즈 연지 모델이 뭐니라고 질문했던 것처럼 그런 질문들을 입력을 하면 여기서 찾겠죠
41:34
최종적으로 라즈 랭지 모델을 거쳐서 대답을 내놓게 된다라고 하고 있습니다 뭐 이렇게 이루어지는 것도 있고 그냥
41:41
뉴로 네트워크 모델을 통과해서 즉각적으로 대답을 내놓는 경우도 있습니다 그러면 우리가 질문을 하면
41:47
여기에 대한 대답을 결국엔 라지 랭지 모델에서 내놓아야 되잖아요 그 내놓는 과정을 어떻게 처리를 하고 있는지
41:54
한번 보겠습니다 지금 오른쪽 쪽에 모시는 그림이 트랜스포머 구조고 여기 인풋과 아웃풋 레이어로 구성이 되어
42:01
있는 것을 볼 수 있어요 인풋에 질문하는 거 GPT 뭐 질문을 한다면 그러한 것들이 다 인풋에 들어가는
42:07
거고 그것이 아웃풋 단으로 넘어가서이 아웃풋 단에서는 대답을 생성하는 것이라고 보면 되거든요 여기서 중요한
42:14
것이 왼쪽 그림에 있는 셀프 어텐션이라는 겁니다 기본적인 딥러닝 모델 예를 들어서 이미지를 분류한다는
42:21
글씨가 어떤 글자인지를 분류한다는 이런 분류 모델은 데이터 자체 의 특징만 뽑아내면 됐었어요 그런데 언어
42:29
같은 경우는 결국에는 시간에 따라서 계속해서 내가 어떠한 소리를 말을 하고 있는 거잖아요 근데 그 말을
42:34
하고 있는 것이 인과 관계가 있어요 예를 들어서 뭐 한국어 같은 경우는 주어 다음에 목적어 다음 동사가 오고
42:40
영어 같은 경우는 주어 동사 목적어 이런 순으로 어순이 아는 것이 있고 그리고 그 문장이 모여서 문단을
42:46
형성할 때 문장과 문장 사이에도 어떠한 관계가 있어요 그러한 관계들을
42:52
찾는 것이 셀프 텐션이라 구조에서 우리가 찾을 수 있거든요 같은 문장 한 문장 내에서 단어와 단어 사이의
42:59
연관관계를 상관관계를 보는 겁니다 그래서 지금이 문장 사이에서이라는
43:04
것이 가르키는 것이 애니멀이 그든 그래서이 두 개의 연관성이 높다라고
43:09
하고이 애니멀이 걸 분석을 할 때 자기 문장에 있는 다른 단어인 이세 이세 조금 더 가중치를 두는 거예요
43:16
이런 식으로 언어의 구조에 대한 이해 어떻게 하면 조금 더 자연스럽게 말을 할 수 있는지를 컴퓨터가 학습을 하게
43:22
되는 것입니다 데이터셋 같은 경우는 인터넷에서 있는 방대한 양의 텍스트 데이터를 모은다고 했잖아요 논문 같은
43:29
전문적인 것부터 그냥 일반적인 인터넷의 글처럼 조금 문법이 틀릴 수도 있는 혹은 어순이 안 맞을 수도
43:35
있는 그런 데이터까지 다 포함하는 겁니다 결국에는 언어에 대한 구조를 배울뿐만 아니라 널리 알려진
43:41
지식까지도 다 습득을 할 수 있는 거예요 그리고이 지식들을 습득을 할 때 월드 임베딩이 것을 이제 사용을
43:47
하게 되는데 월드 임베딩이란게 무엇이냐면 결국에는 이런 단어와 단어들이 컴퓨터가 이해하려면 숫자로
43:54
변환이 돼야 돼요 숫자로 변환을 할 때 데 조금 더 연관성이 높은 단어들은 유사한 숫자들 그리 묶이는
44:00
겁니다 여기 수도와 국가가 지금 다 이렇게 짝지어져 있어요 이것들을 다
44:05
하나의 숫자로 할당을 한다고 생각을 할 때 어 같은 국가와 도시의 묶음들이 같은 숫자로 좀 비슷한
44:12
거리에 있는 숫자들로 묶인다는 겁니다 이것이 월드 임베딩의 원리인데 위에처럼 셀프 텐션을 활용한 이런
44:18
기본적인 언어 모델을 사용하면 비슷한 것들은 비슷한 숫자로 맵핑이 된다는 것을 확인을 할 수 있어요 그래서
44:25
이것이 월드 임베딩의 특징이고 그래서 결국에는 어떤 특정한 태스크 즉 손글씨 분류 혹은 뭐 뭐 예측 같은
44:33
특정한 태스크를 목적으로 학습을 하는 것이 아니라 언어 모델 자체의 것을 학습을 하기 때문에 반화 돼 있어요
44:39
굉장히 예를 들어서 분류 문제라든지 혹은 내가 어떤 텍스트를 넣었을 때이 텍스트가 부정적인 감정을 담고 있는지
44:46
긍정적인 감정을 담고 있는지 그러한 특정한 문제를 풀고 싶을 때는이 라지 랭귀지 모델을 갖고 와서 거기서
44:52
파인튜닝 즉 여러분들의 데이터로 조금 더 학습을 시 시키는 겁니다 llm 자체가 이런 파인 튜닝을 할 수
44:59
있도록 잘 설계가 되어 있어요 최지 PT 같은 경우도 사실은 gpt3 GPT 4라는 이런 사전 학습
45:05
모델에서 맞춤형으로 이제 발전이 된 거거든요 그래서 이렇게 파인 튜닝해 사용할 수 있다라는
45:12
것입니다 하나 문제점을 알려 드리자면 인터넷에 있는 방대한 양의 자료를
45:17
가져와서 학습을 한다고 했잖아요 뭐 지식도 학습을 한다고 할 수 있는데 스피치라고 혐오 발언 증오 발언이라고
45:23
하는 건데 결국에는 노출될 수밖에 없 없어요 그러 이러 것들이 다 학습이 되고 사람들이 다 걸러 줘야 된다는
45:29
거죠 가짜 뉴스를 생성한다는 갈등을 유발할 수 있는 문제들을 해결하는 것이 지금 LM 모델에서 사람들이
45:36
연구하고 있는 분야들 중에 하나입니다 또한이 GPT 포함해서 굉장히 모델 자체가 커요 그렇다 보니까 결국에는
45:44
그 모델을 저장하고 관리하기 위해서 전기세가 많이 나갑니다 우리가 상상할 수 없는 많은 양의 메모리가 필요
45:50
필요한데 어 전기세가 감당이 안 될 정도라고 합니다 그래서 이러한 리소스 관리 같은 것도 LM 주요 과제라고
45:57
볼 수 있고요 당연히 인터넷에는 영어 스페인어 이런 것들이 많고 한국어 같은 경우에는 비교적 적어요 그렇기
46:04
때문에 티에도 한국어를 입력하면 생성하는 속도가 좀 느립니다 아직까지도 LM 모델에서는 데이터가
46:10
적은 한국어는 비주류에 속하기 때문에 비주류 언어에 대해서도 개발을 하려는 것이 많은 기업들과 연구소에서 하고
46:17
있는 것들입니다 이렇게 LM 대해서 가볍게 한번 알아봤고 영상 마무리하도록
46:24
하겠습니다
46:36
안녕하세요 이번 영상에서는 최근에 최지 피트의 대화 기능이 추가되었다고 해서 저도 한번 사용하려고 해보려고
46:42
합니다 hgpt 대화 기능을 사용하기 위해서는 데스크탑이 아닌 패드 혹은 스마트폰 환경에서 사용을 해야
46:47
되는데요 기본적으로 GPT 어플 최지 PT 어플을 다운로드 받으셔야 합니다 익스플로러 창에서 하는 것이 아니라
46:54
직접적으로 여러분들이 어플에 깔 하는 것 우선 알아두시면 좋을 것 같고 이렇게 어플을 들어가 보면 기본적으로
47:01
메시지를 입력할 수 있는 창이 나와 있어요이 창 위에 보시면 여기 위에 보시면 어 헤드폰 헤드셋을 헤드셋
47:09
아이콘이 있는데이 헤드셋 아이콘을 클릭을 하면 GPT 대화 기능이 시작이 됩니다 만약이 기능이 보이시지
47:16
않는 분들은 여기 세팅을 들어가셔서 세팅에서 직접 활성화할 수 있는
47:21
기능이 있을 거예요 만약에 이것이 없다면 이게 아직 베타 버전이기 때문에 랜덤으로 지금 부여가 된
47:27
상황이에요 그래서 어 정식으로 출시가 될 때까지 기다려 주시면 감사하겠습니다 그래서 한번 켜보도록
47:33
하겠습니다 그러면 이렇게 문구가 뜨다가네 지금 저의 제 말을 듣고
47:39
있네요 우선은 제가
47:45
한번네 제가 한번 물어 물어보도록
47:54
하겠습니다 네 이런 식으로 조금 딜레이가 있지만 제발 알아듣는 것을 확인을 할 수
48:00
있어요 다른 걸 한번
48:11
물어볼게요네 이런 식으로 대화가 가능한데 지금 완벽하지는 않은
48:16
모양이에요 제가 분명히 나한테 무가를 물어봐라 했는데 지금 다른 대답을 내놓고 있잖아요 이렇게 아직까지
48:24
GPT 뭘 물어보지는 못해요 그런데 제가 뭘 물어볼 경우에는 GPT
48:29
능동적으로 대답해줄 수가 있습니다 예를 들어서 뭐 이런 걸 한번
48:54
물어볼게요 are AB I want to
49:02
relax for their serene landscape and comfortable accommodation think about a beach
49:08
destination like the males or the caribbean for sun sand and If you prefer a cooler
49:13
climate maybe a mountain retreat in the swiss or the Canadian rockies could offer you
49:18
Peace and
49:24
traps 네 이런 식으로 들어봤어요 기본적으로 조금 말이 많습니다 말이 많기 때문에
49:31
어 좀 듣는데 시간이 좀 걸릴 수 있습니다 그래서 짧게 짧게 대답을 해
49:36
달라고 요정을 할 수도 있어요 제 영어로 회화를 해 봤었는데요 한국어로 대답을 해 달라고 해 보겠습니다
49:41
한국어로 한번 물어볼게요 안녕 안녕하세요 어떻게
49:47
도와드릴까요네 이런 식으로 제가 한국어를 물어보면 한국어로 대답을 해주고 언어도 감지할 수 있는 기능이
49:54
지금 탑재되어 있는 상황입니다 그래서 이렇게 뭐 영어 영어도 되고 한국어도 되고 다양한 언어가 가능은 합니다만
50:01
영어가 아직까지는 성능이 좋습니다 그래서 영어 말고 다른 언어 같은 경우는 되긴 하지만 성능이 그렇게까지
50:07
많이 나오진 않는다 좀 틀린 대답을 내놓을 수 있다라는 것을 염려해 주시면 될 것 같습니다 이거를 뭐 여행 갔을 때
50:15
사용하면 되게 좋을 것 같아요 그래서 유럽 여행을 갔는데 그 나라 언어가 안 된다지 하면 이거를 직접 물어볼
50:21
수도 있을 것 같습니다 예를 들어서 뭐 프랑스로 여행을 갔다 할게요 지하철 타려 어디로 가야 하 하나라고
50:27
물어보려고 프랑스어로 어떻게 물어보는지 한번 물어보겠습니다 프랑스어로 지하철을 타려면 어디로
50:33
가야 하나요 어떻게 말하나요 프스 지하철을 타려면 어로 가야
50:41
하나요 말할어요 더 물어볼 거 없으니까 여기까지 하도록 하겠습니다 이런
50:47
식으로 번역까지 가능하다라는 것을 알아두면 좋고 되게 여행갈 때 되게
50:52
유용하게 사용할 수 있을 것 같아요 그리고 방금 기억이 안 날 수도 있잖아요 기억이 안 날 수도 있기
50:57
때문에 대화 기능을 끄고 밖으로 나와보면 이때까지 내가 했던 물어봤던 것들 그리고 이제제 답변했던 것들
51:04
전부 다 이렇게 로그로 남아져 있습니다 그래서 보시면은 지금 제가 물어보지 않았더라도 하고 있는 말도
51:10
다 지금 녹화가 녹음이 된 모양이에요 그래서 이런 식으로 여러분들이 확인하고 또 다시 복귀를 할 수
51:17
있다라는 정도를 알아두시면 될 거 같습니다 그래서 이런 거를 이용해서 영어 회화를 공부한다던 아니면 말하는
51:23
거를 연습한지 하면 상이 여러분들이 스스로 영어 회화를 공부하거나 혹
51:28
외국어를 공부할 때 사용을 할 수 있을 것 같아요 주의 사항이 있다면 언어를 섞어 사용하면 성능이 좀
51:35
떨어지는 현상이 발생을 합니다 예를 들어서 영어로 물어봤다가 그리고 한국어로 물어봤다가 혹은 한국어로
51:41
프랑스어를 번역해 주세요 했다가 영어로 일본어로 번역해 주세요 이런 식으로 하면이 친구가 언어를 섞어서
51:46
대답을 내놓는 경우가 있습니다 그래서 여러분들이 가급적이면 한 대화 실전에서는 하나의 언어를 사용하고
51:53
그리고 되도록이면 영어를 사용하면 좋지만 불가피할 경우에는 한국어도 가능하다라는 걸 알아두시면 좋을 것
51:59
같습니다 역시나 기본 취지 루를 따르기 때문에 어 금지되어 있는
52:04
단어들 혹은 문장들은 여전히 똑같이 나온다는 것 확인을 하고 잘 유용하게
52:10
사용해 주셨으면 감사하겠습니다 이렇게 GPT 대화 기능에 대해서 알아보았고 베타
52:15
버전이지만 계 앞으로 계속 출시가 된다면 여러분들이 잘 사용할 수 있을 것이라고 생각합니다 영상
52:24
마치겠습니다 [음악]
'say와 AI 챗봇친구 만들기 보고서' 카테고리의 다른 글
구글이 발표한 SELF-DISCOVER 기술 [LLM이 스스로 추론 구조를 발견하면서 GPT4도 Gemini도 모두 성능이 좋아집니다!] (0) | 2024.02.21 |
---|---|
동영상이 이제 정말 자연스럽게 생성됩니다. Runway, Pika Lab, Stable Video Diffusion 모두 이겨버린 구글... [압도적 성능의 이유는 시공간 결합?] (0) | 2024.01.30 |
[자막뉴스] 챗GPT 시대 '사용법' "이거 모르면 망한다~" (0) | 2024.01.25 |
저글링 2~3마리 모았더니 울트라리스크가... [작은 AI 모델을 섞기만 하면 GPT3.5보다 성능이 좋다는데 이건 온디바이스AI 혁명입니다] (2) | 2024.01.25 |
2024년 인생 자동화 AI 툴 14가지 (1) | 2023.12.31 |