본문 바로가기

say와 AI 챗봇친구 만들기 보고서

신소재 38만 개 발견! 구글 Deepmind GNN 기반 AI 모델 GNoME

728x90
반응형
SMALL

신소재 38만 개 발견! 구글 Deepmind GNN 기반 AI 모델 GNoME (안될 공학 에러 인터뷰)

 

AI가 신소재 발견하는 방법은?

AI가 발견한 신소재가 실제로 개발될까?

발견하는 갯수만큼 제작할 수 있을까? *

오늘의 게스트 : 유튜브 안될 공학 채널 에러 평소 만날 수 없는 명사들을 랜선으로 만나보자!

최신 연구/과학 이야기를 들어보는 본격 인물 탐구 과학 탐구 콘텐츠 [안될 과학 인터뷰]!

 

지금이 미 기억나십니까 초전도체
0:02
최근에 주목받았을 때 실제로 인간이
0:05
실험적으로 해서 이렇게 막 찾았다고
0:07
하면은 800년이 걸릴 건데 이번에
0:10
그놈이 진짜 그놈 한 거죠 사겼으면이
0:13
둘을 연결을 시켜 놓은 거예요 대단한
0:14
사람 몇 보입니다 지금 그래서 제가
0:16
좀 확대를 해 보니까 여기 보시면은이
0:18
문명이 우리가 후보로 보고 있는
0:20
다양한 물질들에 대해서 실제로
0:22
안정적인 물질이 합성이 되는지 안
0:23
되는지를 빠르게 할 수 있는 것도
0:25
지금 같이 하고 있다는 것으로 보시면
0:27
되겠습니다 어떻게 보면 과학을
0:28
접근하는 방식 자체 바다라고 보시면
0:31
될 거 같아요 진짜 새로운 시대가
0:32
열릴 것
0:35
같은데 인사 시간입니다 안될과학
0:39
이야기입니다 반갑습니다 자 오늘
0:41
저희가 드디어 특급 게스트 드디어이
0:43
분을 모셨네요 안될 공학 에러 님
0:45
안될과학 첫 출연인데 에러 님을
0:47
격하게 환영합니다 반갑습니다
0:49
와 반갑습니다 교수님들 안될 공학
0:53
에러입니다 반갑습니다 여러분
0:56
반갑습니다 저희가 드디어 이렇게
0:57
콜라보를 하게 됐어하게 했었으면
1:01
좋았을 텐데 안돼 가게 생각보다
1:03
덩치가 너무 커져 가지고 아이 저
1:05
같은 어 작은 규모에 작은 소형
1:08
유튜버가 이렇게 비비기가 좀 쉽지가
1:09
않더라고요 그 명예의 실추가 되지
1:11
않도도 저도 열심히 하고 있는 게
1:13
되겠습니다 저도 요새 안될 과학은 좀
1:16
나중에 볼 때도 있거든요 안될 공학은
1:18
알람 뜨면 바로바로 봅니다 오늘 또
1:20
저희가 되게 콜라보 하기 좋은 기사가
1:22
떠 가지고 보자마자 제가 에로 님한테
1:23
연락을 했죠 지금 저희가 AI 정말
1:27
세상에 많은 것들을 집어삼킬 거사
1:29
같은 분위기인데 과학 연구 분야도
1:32
지금 예외가 아니요 유공 지능을
1:34
활용한 연구의 어떤 혁신 이런
1:36
사례들이 좀 하나둘씩 나오는 거
1:37
같아요 그래서 오늘 그 이야기 한번
1:39
에러님께 안될 과학 안될 공학
1:41
콜라보를 한번 들어보도록 하겠습니다네
1:43
오늘 안될 과학과의 첫 콜라보에서
1:45
안될 공학 에러가 설명드릴 내용은
1:47
바로 구글 놈입니다 구글이 구글
1:49
놈이라는 거를 만들었는데요 이게 결국
1:52
AI 어떤 신소재 개발의 결합을
1:55
생각하시면 되는데요 그래서 제가이
1:57
채즈 피티를 이용해 가지고 또 신
1:59
신소재 관련해서이 좀 만들어 줘
2:02
하니까 요런 그림을 만들어 내더라고요
2:04
그래서 우리가 사실 생각해 보면은이
2:05
어떠한 신기술을 개발을 할 때 뭐
2:08
모든 것들이 다 중요하긴 하지만
2:10
특히나이 재료와 관련해서는 상당히 이
2:12
발전과이 상용화가 쉽지가 않은
2:14
부분들이 있죠 실제로 인류가 현재
2:16
알고 있는 실제로 쓸만한 안정적인
2:19
재료가 겨우 수만 개에 불과하다고
2:21
합니다 그니까이 수만 개를 갖고 이걸
2:23
지지고 벗고 합치고 합성했다
2:25
풀었다가이 짓을 하면서 뭐 하성도
2:28
가려고 막 어 스페이스엑스 올리고 또
2:30
반도체 칩도 만들고 그다음에 넥스트
2:32
배터리 소재 요런 것도 만들고 뭐
2:34
태양광 패널 같은 것도 만들고 이런
2:36
것들 다 특정한 재료가 특정한
2:38
조건에서 우리가 원하는 동작을 해
2:40
내야지만이 인류에게 쓸모가 있는 그러
2:43
것들을 해 주는 거지 않겠습니까
2:45
그런데 이러한 새로운 물질을 계속
2:46
발굴을 해내야 되는데 현재 알고 있는
2:48
거는 수만 개다 뭐 수만 개 많다고
2:51
보실 수가 있어요 그런데 이게 또
2:53
현재이 수만 개로서 할 수 없는
2:55
것들이 워낙 많다 보니까 우리가
2:57
앞으로 뭔가를 해내려고 하면은
2:59
계속해서 뭔가 물질을 개발해 내야
3:01
되고 이런 새로운 물질을 발견을 하는
3:03
것도 중요한데 발견하고 나서 이거를
3:05
일반적으로 상업에서 하는데도 이제
3:07
수십 년이 걸리는 경우가 많습니다이
3:09
자체를 굉장히 줄일 수가 있다라면
3:11
상당히 중요한 포인트가 되겠죠
3:13
그러면서 제가 오늘 말씀드린 것이
3:14
바로 구글 놈이라고 하는 건데요
3:16
짐작하셨겠지만
3:29
이제 구조를 높은 정확도로 예측을
3:31
하는 거를 2020년도에 발표를 한
3:33
적이 있었고요 그다음에 유전병 검사
3:35
도구인 알파 미센스 아는 것도 발표를
3:37
했습니다 거기다가 최근에는 날씨 예측
3:39
그래프 캐스트라 것도 해 가지고
3:41
기준의 어떤 컴퓨테이션 기반의
3:43
예측도가 높은 AI 모델을 발표하기
3:45
냈죠 그런데 이번에는 새로운 물질을
3:48
발견해 낼 수 있는 이런 성과를
3:49
냈다는 것이죠 그게 바로 구글 놈이
3:51
되겠습니다 원래 디마인드 알파폴드
3:53
같은 경우는 단백질 구조 예측하는
3:55
애였어요 물론 이제 3D 구조를 되게
3:58
예측하기가 어려워
4:00
우 이제 과학자들의 한계에 도달한
4:02
상황에서 인공지능이 그 문제를 해결해
4:04
준 건데 이번에는 구조가 아니라 아예
4:06
새로운 거를 그냥 만들어 버리는
4:08
그런 게 나왔군요 그렇죠 이게 얼마나
4:10
큰 효과냐 얼마나 큰 성과인 이제를
4:12
보시면은 타임지의 헤드라인을 보시면은
4:14
렇게 돼서 있습니다 구글 딥마인드
4:17
AI 브레이크 스루다 이게 어디에
4:19
도움이 된다 배터리와 칩 개발에
4:21
도움이 된다 요거를 좀 더 파고들면
4:23
좀 재밌을 것 같아요 그러니까 우리가
4:25
새로운 물질을 발견하려면 주기표 쫙
4:27
펼쳐 놓으면은 뭐 굉장히 많은
4:28
원수들이 죠 그리고 그 굉장히 많은
4:30
원소들을 요렇게 저렇게 조합을 하는
4:32
거 자체가 지금 엄청나게 조합 수가
4:34
많잖아요 근데 이거를 뭐 인간인 거
4:36
다 해보겠습니까 다 해 볼 수가 없는
4:38
상황인데 요거를 AI 통해서 뭔가
4:39
혁신적으로 빠르게 했다는 거를
4:41
짐작하실 수가 있겠죠이 새로운 소재를
4:43
발견을 했다라는 거는 지금 뭔가 뭐
4:46
초전도체에 상당히 이슈가 됐었고
4:48
거기다가 차세대 배터리 부분 뭐
4:50
전고체 배터리 이런 거 있잖아요
4:51
거기다가 슈퍼컴에 들어가는 프로세싱
4:52
유닛이라는 아니면은 전기 자동차에
4:54
들어가는 뭐 전기 모터 아니면 태양
4:56
전지 같은 것들 아니면 새로운 형태의
4:58
반도체 기술 술들 이러 모든 것들에
5:00
대해서이 소재 자체에서 기준에 없던
5:03
거를 새롭게 발견해서 아 요걸 쓰면은
5:05
기존보다 훨씬 더 반열이 줄어들고
5:07
성능도 좋아지는 이런 소재를 발견
5:09
한다거나 아니면 초전도체가 상온에서
5:11
현실화가 된다면은 상당히 많은 곳에
5:12
적용할 수 있다는 다양한 예들이
5:14
있듯이 이러 것들의 후보 물질들을
5:17
찾는 거에 기여를 할 수 있다는 게
5:18
되겠습니다 한 가지 예를 보시면은
5:20
지금이 민 기억나십니까 초전도체
5:23
최근에 주목받았을 때 하나하나씩 다
5:25
초전도체 굽고 있다 이런 얘기
5:26
있었잖아요네 결국 초전도체 lk9
5:29
나인이이 세라믹 합성 물이다 보니까
5:32
마치 장인이 이렇게 만들어 놓고 아
5:34
이게 아니야 이러면서 뭐 부스들이
5:35
요렇게 하나하나 만들어 보고 또 여기
5:38
실험적으로 어떻게 해 봐서 원하는
5:40
형태를 만들어 가는 그런 게 기존의
5:42
어떤 방식이죠 그래서 기존에는 뭐
5:44
컴퓨터 시뮬레이션을 통해서 이렇게
5:45
분자 구조를 이렇게 맞춰 본다거나
5:47
아니면 직접 이렇게 이것저것 합성을
5:49
해 보는 거죠 뭐 열도 해보고 압력도
5:51
좁아 가면서 아니면 적에서 분광학
5:53
이라든가 다양한 분광학적 방법들이
5:54
있잖아요 요런 걸 토대로 해서 뭔가
5:56
무기물 분자를 합성해서 특성을 뽑아
5:58
낸다든가이 다양한 방법 식들이
5:59
있습니다 엑스레이를 쏜다거나 그런
6:01
식으로 접근해서 요렇게 했을 때 어떤
6:02
특성이 보이나 저렇게 했을 때 저런
6:04
특성이 보이나 이렇게 기본적으로
6:06
시간이 어마무시하게 많이 드는 그런
6:08
작업이었다는 거죠 근데 그나마
6:10
최근에이 로렌스 버클리 국립
6:12
연구서에서이 머티리얼스 프로젝트 재료
6:15
프로젝트라는 거죠 그래서 이 머티리얼
6:17
프로젝트에서 28,000 개에 달하는
6:19
새로운 소재를 추가로 생산을 해내기도
6:21
했습니다 아 그러면은 여태까지 없었던
6:23
물질인 건가요 그죠 기존에는 없었던
6:25
물질인데 이게 물질이 결국은 이게
6:27
안정화가 돼 있어야 되잖아요 그 상
6:29
태로 그대로 유지가 돼야 되는
6:30
안정적인 물질을 28,000 개를
6:32
찾았다는 건데 이게 얼마나 대단한
6:34
성과야 다음 그래프 보시면요 요게
6:36
이번에 구글에 그놈에서 나왔던
6:38
도시인데 여기 보세요 인간이 열심히
6:41
실험을 해서 만들어서 찾았던게 2만
6:43
개인데 여기서 계산적인 방법을 통해서
6:45
48,000 개를 추가를 했죠 이것만
6:46
해도 대단해요 사실 그런데 여기에다가
6:48
추가로 또 더 확장을 해 가지고
6:50
42만 1000개까지 찾아냈다 즉
6:53
3.1만 개를 추가로 재료를 찾아
6:55
있다라고 보시면 되겠습니다 근데
6:57
여기서 찾았다는 거의 기준이 이 예를
6:59
들면 뭐 여러 가지 짬뽕을 조합을
7:01
만들잖아요 그러면은 걔가 안정적인
7:03
형태로 있으면 찾았다고 하는 건가요
7:06
포인트를 잘 집어 주셨는데 실제로
7:07
재료를 저 수십만 개를 합성했다 뜻은
7:10
아니고요 어떤 실험적인 결과나 이제
7:12
이론적인 계산에 의해서 이게 안정적인
7:14
물질이다라고 입증할 수 있는 물질이
7:17
추가적으로 38만 개가 찾았다는 거죠
7:19
근데 이게 이제 그놈을 통해서 AI
7:21
통해 더 많이 확장을 된 거고 후보
7:23
가능성이 있는 구조 자체는 220만
7:25
개를 찾았다고 합니다 220만 개를
7:26
찾았는데 그중에서 38만 개는 진짜
7:29
안정적이다 이거 이거 한번 합성해
7:31
봐서 진짜 우리가 한번 물질 제대로
7:33
되는지 한번 보고 싶다고 하는
7:34
후보군을 찾는데이 스케일이 얼마나
7:36
대단한 거냐 실제로 인간이 실험적으로
7:39
해서 이렇게 막 찾았다고 하면은
7:40
800년이 걸릴 건데 이번에 그놈이
7:44
진짜 그놈 한 거죠 여태까지 그 재료
7:47
분야의 소재 분야에 얼마나 많은 천재
7:49
분들이 여러 가지 방법론을 통해서
7:51
2만 개를 발견한 건데 우리 그놈
7:54
신께서 갑자기을 하시더니 24시간
7:57
365일 돌리더니 42만 개 이게
7:59
그걸 찾았구나 이게 끝이 아닙니다
8:01
여기서 저 38만 개가 추가 됐잖아요
8:03
근데 그 중에서 일단 지금 실험실에서
8:05
직접 736 개를 합성을 해 봤어요
8:07
이거 로랜스 버클 연구소에서 직접 한
8:09
것도 아니고 그놈이 한 것도 아니고
8:10
그놈이 요걸 딱 찾은 다음에이 오픈
8:12
소스로 공개를 했거든요 우리 이렇게
8:14
찾았으니까 너네 한번 합성해 봐
8:15
이렇게 쫙 풀었어요 그랬더니 이걸
8:17
보고 좀 이제 쓸만한 것들 이렇게 딱
8:19
해갖고 외부 연구자들이 직접 실험을
8:20
해 가지고 총 합쳐서 736 개를
8:23
직접 합성을 해서 찾았다는 겁니다
8:24
신소재가 갑자기 700 종류 넘게
8:26
갑자기 생겨 버린 거예요 와
8:28
대단하네요 아니 여태까지 우리 인류가
8:30
2만 개를 발견했는데요 며칠 사이에
8:32
700개 넘게 발견한 거네요 애초에이
8:35
220만 개의 후보 중에서 38만
8:38
개가 추가된다 했잖아요 여기 보시는 요
8:40
42만 개라고 하는 거는 기존에
8:41
찾았던 물질의 플러스 38만 개에서
8:43
42만 개가 되는 겁니다 그래서
8:45
이번에 추가로 된요 제일 옅은
8:47
파란색요 하늘색 부분에 해당하는 것
8:49
중에 한 700개가 넘게 지금
8:51
독립적으로 생성해 가지고 만들어졌다는
8:53
거를 말씀을 드리는 거고요 실험적으로
8:55
입정 입증이 됐다 좀 뒤에다 말씀드릴
8:57
건데 요걸 실제로 합성하는 것도
8:59
굉장히 빠르게 해보려고 자동화되어
9:00
있는 것도 있어요 요것도 나중에
9:01
말씀드릴게요 그러면 궁금한 점은 이제
9:04
이게 AI 통해서 도대체 어떻게
9:05
찾았냐 요런 부분이 될 건데 올해
9:08
굉장히 이슈가 됐던 LK 99 때
9:10
한번 소개가 된 적이 있었어요 LK
9:12
99 처음에 딱 해 가지고 세계가
9:14
발칵 뒤집어졌을 때 초기에 로렌스
9:17
버클리 연구소라는 세계에서 가장
9:19
저명한 연구소 중 하나에서 LK
9:22
99이후 초전도체 1 가능성이
9:25
있다는 형태로 논문을 냈거든요
9:26
아카이브에 그때 나온 내용이 df
9:29
이론이라고 소개가 된 게 있습니다 이게
9:31
한국어 번역하면 밀도 함수 이론이라고
9:34
하는 건데요 시티 펑셔널 티어리
9:36
이름만 봐서 모르니까이 대충 후려쳐서
9:38
얘기를 하자면은이 어떠한 특정한
9:39
물질을 이게 구성했다고 쳐요 예를
9:41
들어 뭐 바륨 하나 갖고 오고 칼슘
9:43
하나 갖고 오고 그다음에 뭐 이것저것
9:45
애를 다 붙였다고 칩시다 우리가
9:46
원하는 어떤 구조가 있는데 걔를
9:48
이렇게 시뮬레이션으로 딱 만들었다고
9:50
치면은 우리 고등학고 때 화학 2
9:51
시간에 아 지금이 들으신 분들이 다
9:53
다를 텐데 하여튼 저 같은 경우는
9:54
화투 시간 거기서 막 오비탈 막 이런
9:56
거 하잖아요 그게 뭐 뭡니까 전자가
9:58
확률적으로 어디에 위치 아냐라 거를
9:59
나타낸 거죠 마치 그런 것처럼 특정한
10:02
구조의 물질이 있다고 칩시다 어떤
10:04
물질이 있으면은 그 물질을 구성하는
10:06
어떤 형태가 있지 않습니까 그
10:08
형태에서이 물질 구성해 전자가 어떻게
10:11
위치하느냐에 주는 걸 토대로 해서
10:14
물질의 특성을 추론을 할 수 있는
10:16
요런 형태라고 보시면 될 거 같고요
10:17
nacl 같은 경우에 어떤 특정한
10:19
격자 구조를 가지고 있을 텐데 그런
10:21
격자 구조에 있을 떼이 전자들이
10:23
확률적으로 어디에 위치할라는 걸
10:24
추정을 하듯이 우리가 어떠한 특정한
10:27
신소재가 있다면은 그 신소재 특정 한
10:29
구조를 가지고 있을 거잖아요 그럼 그
10:30
분자 구조를 가지고 있을 때에
10:32
전자들이 어디에 위치하느냐에 어디
10:34
위치하느냐에 토대로 해서 슈퍼컴으로
10:35
돌려 갖고 하면은 나온다라는 거죠
10:37
그럼 그걸 토대로 해서 아이 물질은
10:39
뭔가 전기가 잘 통할 거야 아이
10:41
물질은 설마 초전도체 약간 이런
10:43
식으로 추정을 할 수가 있는 하나의
10:44
추정 방법이라고 보시면 될 것
10:46
같습니다 이러 dft 이론을 확립해서
10:48
물질의 여러 가지 구조를 분석하고
10:50
추정할 수 있는 이런 로렌스 버클
10:51
연구서에 어떤 다양한 연구 결과들이
10:53
있겠죠 요거를 구글이 가져온 겁니다요
10:56
내용을 일자 가져와 가지고 요거를
10:58
AI 학습을 한 거예요 그래서 애초에
11:00
아까 말씀드린 머티리얼스 프로젝트라고
11:02
말씀드렸죠 재료 프로젝트 요게 이미
11:04
로렌스 버클 연구소에서 진행이
11:05
되어왔고 물질의 각각의 특성에 따라서
11:07
예를 들어 뭐 전기가 잘 통한다 그라
11:09
뭐 자성을 뛴다거나 요러 것들에
11:11
대해서 각각의 물질들의 어떤 특성들이
11:13
있을 거잖아요 그런 것들에 대한
11:14
다양한 데이터들을 확보를 해 놓은 게
11:16
있을 텐데 이러한 여러 가지 피처를
11:18
이렇게 매핑을 해서 갖고 있다 보면은
11:19
그거를 싹 가져와 가지고 AI 모델로
11:21
학습을 시켰다고 보시면 될 거 같고요
11:23
그래서이 근원 같은 경우에는 로렌스
11:25
버클리 연구소에서의 이 머티리얼스
11:27
프로젝트에서 나온이 재료 그죠 그리고
11:29
재료마다의 안정성 데이터를 가져와서
11:32
약 69,000 개의 물질 데이터로
11:34
모델을 학습시킵니다 여기서
11:36
사용됐다는게 바로 gnn이라고 하는
11:39
건데요 혹시 CNN rnn 이런 거
11:41
많이 들어보셨습니까 nn 하면 보통
11:43
이제 뉴럴
11:44
네트워크고리 생소하실 수도 있어요는
11:48
딴게 아니고 그래프입니다 사실 그래프
11:50
뉴럴 네트워크를 gnn이라고 하는데
11:52
구글 놈이이 gnn 사용을 했다고
11:54
합니다 요걸 좀 한번 살펴보도록
11:56
하시죠 일단 그래프라는 거를 생각을
11:58
해 봐야 되 는데 양 님 요거 뭔지
12:00
아시죠
12:02
남녀구분 하이스쿨 러브 다이어그램이라
12:05
가지고 요게 이제 그래프 구조에 한
12:07
예를 얘기하는 건데요 지금 보시면
12:10
여러분 까만게 남자고 하얀 게 여자죠
12:13
그래서 얘네들이 실제로 사겼으면이
12:16
둘을 연결을 시켜 놓은 거예요 대단한
12:18
사람 몇 보입니다 지금 그래서 제가
12:19
좀 확대를 해 보니까 여기 보시면은
12:21
몇 명이야 하나 둘 셋 넷 다여
12:24
일곱명이야이 일곱 명을 이분은 또
12:26
이제 여자도 사귀고 남자도 사귀고 어
12:30
굉장히 다양하게 다이버시티 좋은
12:31
학교인 거 같습니다 그래서 여기서
12:33
말씀을 드리고자 하는 거는 여기에 뭐
12:35
숫자 같은게 있습니까 뭐 사실 우리가
12:37
이렇게 하나하나 세면은 요게 하나 둘
12:39
셋넷다섯여섯일곱 명이나 사겠네
12:41
이렇게 얘기를 할 수 있지만
12:42
기본적으로 그래프라고 하는 수학적인
12:44
정의는 그냥 어떠한 점과 점이
12:47
있으면은 각각 객체들이 있겠죠
12:48
얘네들이 어떤 연결 관계를 가지고
12:50
있느냐 없느냐 나타낸 거예요 그걸
12:52
그래프라고 정의를 합니다 그래서 예를
12:54
들어 여기서 이렇게 핫한 친구가
12:56
얘하고 아무런 관련이 없다는 거죠
12:58
어떻게 보면은 무슨 말씀인지
12:59
아시겠죠이 그래프에서 나타나는 정보는
13:01
적어도 얘가 얘들과 어떤 관계를
13:04
가지고 있구나라는 건 알 수 있고
13:05
얘와 이웃한 다른 애가 요렇게 한
13:08
단계 건너면 뭐 x 보이프렌드 뭐
13:10
이렇게 계산 할 수가 있는 거죠
13:12
그런데 얘와 얘는 정말 멀리 떨어져
13:14
있구나 정말 아무 관계가 없다고 할
13:16
수도 있겠구나 이전으로 돌아가
13:17
보시면은 아예 관계 없는 애들 있죠
13:19
얘랑 얘는 진짜 아무런 관련이
13:21
없다라는 거예요 사귄다는 정의에서
13:23
요러 거를 이제 그래프라고 부릅니다
13:25
그래서 점과 선으로 이루어진 구조다
13:27
그 이게 가장 널리 잘 사용되는
13:29
사례로 보면은 넷플릭스 추천
13:30
시스템이라고 보시면 돼요 이게
13:31
넷플릭스 추천을 보면은 사람마다이
13:33
추천되고 있는 것들이 다 다르잖아요
13:35
왜냐하면은 내가 어떤 거를 봤다 어떤
13:38
거를 좋아요 했다 어떤 거를 찜했다
13:40
중간에 보다가 뛰쳐나왔다 이러한
13:42
정보들이 다 다르기 때문에 그거에
13:43
따라서 아 얘가 이걸 좋아할 거야라고
13:46
링크 프레딕션이라고 하는데 연결을
13:48
시켜 놓으면은 거기에 연관돼 갖고 그
13:50
그래프들을 따라가보면 아 얘가 얘도
13:52
좋아할 거야 쟤도 좋아할 거야 이런
13:54
식으로 판단 내릴 수가 있거든요 요런
13:56
형태로 그래프 구조를 많이 활용하기도
13:58
하고 아니면 그래프를 아까 이전에서
14:00
봤듯이 요렇게 하나로 묶어 버리면은
14:02
요게 그룹 1이 될 거고 그룹 2 3
14:05
4 5 이렇게 나눠줄 수도 있겠죠
14:07
이렇게 서로 연결되었다는 관계만
14:09
확립이 된다 하더라도이 그룹을
14:10
클래시피케이션 하는 모델도 씁니다
14:12
그래서이 그래프 클래시피케이션 부분을
14:14
잘 생각해 보면은 뭔가 신소재 분자
14:17
구조를 새롭게 찾는 것과 비슷해요
14:19
어떤 특정 원자가 들어간다거나이
14:20
얘들끼리 뭐 두 개 연결 됐다거나
14:22
이런 것들을 구성할 수 있으니까 이런
14:24
그래프의 연결 관계만을 가지고 와서
14:27
아 이런 구조를 가지 있으면은 어떠한
14:29
피처를 가지고 있더라 이런 식으로
14:31
학습을 시키도록 한 게 바로
14:33
gnn이라고 부르는 그래프 뉴럴
14:35
네트워크라고 하는 것이 되겠죠 아
14:37
이게 그러니까 이해가 되는 부분이
14:39
약간 예를 들면 아까 핫한 친구
14:41
있었잖아요 원소나 원자 이렇게 보면은
14:45
탄소 이런 애들은 다른 애들이랑 잘
14:47
붙자아요 수소 이런 애들 주기율표
14:48
중에서도 핫한 애들이 있단 말이야
14:50
근데 막 100번대 이런 애들은 다른
14:51
애랑 잘 안 붙지요 근데 그중에서
14:54
자기들끼리 또 잘 붙는 애들도 있고
14:56
또 혹은 주기표 중에서도 여러 그
14:58
그룹 그룹들이 있잖아요 이금 속부터
15:00
해 가지고 알칼리 뭐 뭐 이렇게 해서
15:03
걔네들이 잘 붙는 또 다른 애들도
15:05
있고 그리고 또 걔네들이 어떻게
15:06
붙음으로써 생긴 특성들도 있고 그런
15:08
것들이 있어서 실제로 아마 그런
15:11
신재료 연구하는 분들이 그런 어떤
15:13
경험적 지식을 굉장히 참고를 할 텐데
15:16
이거는 진짜 이렇게 방대한 데이터들을
15:18
가지고 그걸 또 이렇게 만들겠 그래서
15:20
로렌스 버클리 연구소에서 6만 개가
15:22
넘는 그러 정보들을 요렇게 그래프
15:24
구조로서 일단 다시 체계화를 한
15:26
다음에 거기로부터 어떤 특성을
15:27
가지더라 것들을 같이 엮어 가지고
15:30
학습을 시켜 버리면은 다시 새로운
15:31
형태로 이제 인퍼런스 추론을 할 수가
15:33
있을 거고 그렇게 나온 것들을 다시
15:35
역으로 안정적인 상태인 건가 아닌가
15:37
이런 거를 판단할 수 있는 그런
15:38
형태로 그놈이 접근을 하셨다고 보시면
15:40
되겠습니다 보통 이런 거 연구하신
15:42
분들은 아 저거랑 저거랑 안 붙어
15:44
이런게 있을 수 있잖아요 근데 인공지
15:46
그냥 데이터로 말을 하니까 진짜 많이
15:48
발견할 수밖에 없겠네요 그 또 이게
15:50
또 되게 스마트하게 접근을 했어요
15:51
방금 말씀하신 포인트가 굉장히 핵심이
15:53
되기도 하는데 gnn이라고 하는
15:56
것들을 이렇게 두 가지 구조로
15:57
만들었어요 이 파이프라인이라는 두 개
15:59
돼 있죠 한 개는 스트럭처를
16:01
파이프라인이라는 한 개는 컴포지션
16:04
파이프라인이라는 경우에는 좀 쉬어요
16:06
우리가 갖고 있는 이미 발견된
16:08
재료들이 다양하게 있을 거잖아요
16:09
걔네들을 조금조금씩 변하면서이
16:11
구조들을 10억 개 이상을 발견을
16:13
했다고 합니다 예를 들어 요러한
16:15
공모양의 구조가 있는데요 두 개를
16:16
살짝 바꿔 보자 그러면 그래프 구조가
16:18
이렇게 되니까 요거에 안정성이 어떻게
16:20
될 거냐 진짜 안정적이면 아 신소재
16:22
물질이다 잘 안 붙으면 아 이거는
16:24
새로운 재료가 아니네 이렇게 판정할
16:25
수가 있겠죠 요렇게 인간이 이미
16:27
실험적으로 혹은 이론적으로 확립하고
16:29
있는 데이터를 토대로 그 구조를
16:31
가져와서 10억개 이상을 생성하는
16:33
것뿐만이 아니라요 밑에 컴포지션
16:36
파이프라인은 화학식을 일단 맞춰 본
16:38
거예요 이게 뭐 기존에 말이 됐건 안
16:40
됐건 그냥 일단 맞춰 본 다음에 요걸
16:42
토대로 또 안정성을 본다라는 거예요
16:43
그러니까 기존에는 사실 신소재를
16:45
연구하시는 분들이 요러한 것들을
16:47
막무가내로 시도를 잘 안 하겠죠
16:49
왜냐하면은 기준과 좀 유사한 구조가
16:51
그나마 이렇게 합성이 잘 될 거다라는
16:53
어떤 경험적인 지식이 있을 거잖아요
16:55
근데이 놈 같은 경우에는 애초에 렇게
16:57
화학실 자체로 자기 자기들이 막
16:58
이렇게 합성해 놓고 잘 맞춰 놓고
17:00
그런 다음에 요게 안정성에 대해서는
17:02
따로 볼 수 있는 구조가 되니까
17:04
새로운 구조를 확립하는 방법이 굉장히
17:06
폭넓게 적용됐다는 부분 요게 좀
17:08
포인트입니다 그러네요 이게 예를 들면
17:10
요리로 따지면 우리가 뭐 새로운
17:12
메뉴를 만들더라도 어떤 기존의
17:14
방식에서 조금 조금 변형하면서
17:15
하잖아요 왜냐면은 그 시도에 대한 그
17:18
리소스가 많이 들기 때문에 근데
17:19
인공지능은 그런 거 다 무시하고 그냥
17:22
어차피 계속 돌아갈 거수기 때문에 편견
17:24
없이 그냥 막 다 갖다 붙이고 테스트
17:26
할 수 있겠네요 야 이거는 진짜
17:28
인간이 할 수 없는거다 인간이 하면은
17:31
800년 걸린다는 거죠 그러니까
17:32
그래서이 두 개로 나온 것들을요
17:34
dft 아까 말씀드린 그 이론을
17:35
통해서가 그놈의 데이터베이스로 확립을
17:37
하고요 그렇게 해서 굉장히 다양한
17:39
후보들을 이렇게 만들어내는 거죠 근데
17:41
여기서 좀 재밌는 게 요렇게 새로운
17:42
구조로 뭔가 dft 이제 예측을
17:44
하잖아요 dft고 하는 거는 특정한
17:46
신규 구조의 어떤 특성을 추론할 수
17:49
있는 그런 방식이라고 이해를 하시면
17:50
된다고 제가 말씀드렸잖아요 근데이
17:52
신규 구조라는 거는 어떤 건지 잘
17:54
모르잖아요 사실 아직 합성도 안
17:55
해봤고 그냥 아 가능성이 있겠다
17:57
안정성 성이 있구나라는 것들을 이렇게
17:59
추론해서 나오는 건데 마치 LK
18:02
99이상 다음에 아 이게 초 도체 1
18:05
가능성도 있겠다고 말을 하듯이
18:07
신규로 나온 어떠한 소재에 대해서
18:10
안정성이 있으면은요 dft 적용해서
18:12
아이 dft 돌려봤더니 얘가 어떤
18:14
특성이 있네요라고 하면서 다시 여기에
18:17
공급을 한다는 겁니다 그러면은 기존에
18:19
생성했던 것뿐만이 아니라 여기를
18:21
통해서이 데이터베이스 확립된 거에서
18:23
생성된 건데 또다시 들어가니까
18:25
더욱더 양질에 어떤 데이터들이 계속
18:27
피드백 하면서 쌓여가고 AI 모델이
18:30
고도화 될 수 있다는 거 이해를
18:31
하시면 되겠습니다 그래서 지금 보시는
18:33
요러한 물질 같은 경우에는 그놈이
18:35
예측한 물질 중 하나인 바륨 여섯 개
18:38
니오비 일곱 개 산소 21개로 돼
18:41
있는 결정 구조를 찾아냈다는 겁니다
18:43
여기 파란색이 지금 바륨이 그요
18:44
니오비이 회색이고 산소가 녹색입니다
18:47
그 이러한 구조가 안정적일 거다
18:50
그러니까 이러한 재료가 있을 수
18:51
있다라고 그놈이 예측을 했다는 거죠
18:53
이렇게 복잡한 구조를 처음부터
18:55
합성하고 하면은 참 쉽지가 않을
18:56
거잖아요 근데 그놈이 이제 합 학습한
18:58
결과를 가지고 뭔가 예측을 해 보니까
19:00
요러한 것도 안정적일 수 있겠다라고
19:02
하면서 예측을 할 수가 있는 거고요
19:04
거기에 더해서 지금 보시는 요러한
19:06
구조를 포함해서 700개가 넘는 거를
19:08
실제로 외부 연구팀에 의해서
19:10
독립적으로 실현이 되기도 했습니다 그
19:11
중에 좀 재밌는 결과가 우리 리튬이온
19:13
배터리 요즘 많이 쓰잖아요 전기차에
19:15
쓰고 휴대폰에도 쓰고 온간 곳에 다
19:17
쓰게 되는데이 리튬 이온의 전도체가
19:20
될 수 있는 후보군을 500개가 넘게
19:22
찾았다고 하고요 그래핀과 유사한
19:24
구조는 52,000 개까지 찾았다고
19:25
합니다 물론 여기 합성을 하냐 양산
19:27
하냐는 또 다 는 얘기입니다 근데
19:29
이게 가능성이 있다고 예측할 수
19:31
있는 후보군을 이렇게 넓혀 줬으니까
19:33
초조 체라가 신소재라 그가 런
19:35
부분들에 대해서 시도해 볼 수 있을
19:36
만한 풀이 훨씬 더 넓어졌다고 보시면
19:38
되겠죠 그래서 결국은 앞으로 더 나은
19:40
배터리를 만든다거나 아니면 새로운
19:42
칩을 개발 한다거나 이런 곳에 많이
19:45
쓰게 될 텐데 이게 또 후보만 많이
19:47
찾으면 의미가 없으니까 이게 또
19:48
빠르게 합성이 되는지 안 되는지를 좀
19:50
확인을 해 봐야 되지 않습니까 구조만
19:51
찾으면 뭐해 합성을 해야 되는데 근데
19:53
그 연구 결과도 이번에 나왔다는
19:55
거예요 이게 로렌스 버클리 연구소의
19:56
랩이라고 하는 곳이 되게 있는데요
19:58
저렇게 로봇팔로 자동화해 가지고 뭔가
20:01
물질를 합성할 수 있도록 하나의
20:02
프로세스를 다 만들어 놨어요 여기
20:04
200만 달러를 투자를 해서
20:05
18개월이 걸려서 만들었다고 하는데
20:07
저 로봇 매니퓰레이터가 각자 저렇게
20:09
저 재료에 들어가 가지고 각자 부어서
20:12
합성하고 또 결합하고 요런 것들을
20:14
알아서 할 수 있게끔 저걸 계속
20:16
저지만 하는 거예요 저 로봇은 그래서
20:17
우리가 후보로 보고 있는 다양한
20:19
물질들에 대해서 실제로 안정적인
20:21
물질이 합성이 되는지 안 되는지를
20:22
빠르게 할 수 있는 것도 지금 같이
20:24
하고 있다는 것으로 보시면 되겠습니다
20:26
그래서 실제 이게 얼마나 빠르냐라고
20:28
보시면은 17일 동안 3신 다 번의
20:31
실험을 수행을 했고 그래서 여러 가지
20:33
후보군 중에서 41 권을 성공시켰다고
20:36
합니다 계속 이런 식으로 테스트를
20:37
하면 정말 신소재를 빠르게 살을 수도
20:39
있겠죠 물론이 랩이 만들지 못한
20:41
재료도 있어요 17개가 됐는데 건
20:43
실험 자체가 좀 어려운 것도 있었고
20:44
어떤 거는 합성이 되긴 했지만 인간이
20:46
개입을 해서 직접 어떻게 조절을 해
20:48
주기도 했어야 된다고 해요 그러니까
20:49
그놈이 발견한 다양한 물질들을 모두
20:52
합성을 할 수는 없었던 부분도 있는데
20:54
그래도 이렇게 자동화에서 바로바로
20:55
신소재를 만들 수 있다라는 부분은
20:57
상당히 놀란 부분이 아닐까 싶습니다
20:58
그래서이 첫 번째 단계로는 이 머티리얼
21:00
프로젝트와 딥마인드 놈에서 나온 어떤
21:02
구조들을 이렇게 끌어 나오겠죠
21:04
그러면은 요걸 토대로 해 가지고
21:06
실제로이 로보틱 신테시스 한다는
21:08
겁니다 첫 번째가 파우더 도지 이게
21:10
가루를 이렇게 사사사사삭 뿌리는 거죠
21:12
분말을 이렇게 쫙 투입을 한 다음에
21:14
히팅 열을 이렇게 가하는 거죠 그런
21:16
다음에이 소재가 어떤 것인지 캐릭터라
21:18
한 다음에 이런 데이터베이스 기반으로
21:20
야 얘네들이 어떤 것이다라는 거를
21:22
분석할 수 있는 형태로 첫 번째 두
21:24
번째 세 단계를 거쳐 가지고
21:25
자동화하는 거를 했다는 거죠 이게 왜
21:28
자동화가 중요하냐 그놈이 찾은
21:30
물질들이 지금 어마무시하게 많잖아요
21:32
그런 것들을 발견만 하면 뭐 합니까
21:34
빨리 합성해서 찾아야 되는 거니까
21:35
이거를 애초에 알아서 합성하고
21:38
테스트하고 안정화된 것과 그
21:39
실험으로부터 데이터를 뽑아낼 수
21:41
있도록 빠르게 할 수 있도록 유도를
21:43
했다고 보시면 될 거 같아요
21:44
여기까지가 그놈에 대한 설명이었는데
21:46
AI 가능해지다 보니까 물질 물성에
21:48
대해서는 좀 더 공부가 더 필요하긴
21:50
하지만 이런 데이터 기반으로 뭔가
21:52
특성화 될 수 있는 거 캐릭터라이징
21:54
될 수 있는 것들이 데이터화가 되기만
21:56
한다면 그리고 샘플이 충분히 확보만
21:58
된다면은 이런 후보 물질도 알아서
22:01
일단 어느 정도 스코프를 정해 준
22:02
다음에 거기에 대해서 자동화가 연결
22:04
해 버리니까 진짜
22:06
기하급수적으로 이 실험과 신소재를 찾는
22:08
속도가 빨라질 것 같다고 보이는
22:10
부분이 있습니다 그래서 국내에서는
22:12
사실 그렇게 많이 주목을 못 받고
22:14
있는 거 같은데 현재 또 이제
22:16
시장에서는 AI 바이오가 상당히 좀
22:18
주목을 받고 있잖아요 그래서 데이터
22:20
센터도 이제 건립을 하고 데이터센터에
22:22
슈퍼 컴퓨터로 막 돌려서 뭔가 AI
22:24
통해서 물질 구조 특성을 파악하고
22:26
새로운 물질을 찾고 이런 드 시도가
22:28
많은데 앞으로도 이러한 AI 모델의
22:31
어떤 특성화된 이러한 연구가 확실히
22:33
인류에게 도움이 될 거 같은 구글 딥
22:34
마인드와 같은 회사들이 현재 이제
22:36
연구용으로 이렇게 뿌리고 있지만 향후
22:38
1한 플랫폼이 또 주도권을 가져갈 수
22:40
있는 그런 부분이 아닌가 싶습니다 야
22:42
진짜 대박입니다 아니 진짜 완전 다른
22:45
세상에 펼쳐질 것 같아요 이거 뭐
22:47
예를 들면 우리 뭐 배터리라 그가
22:50
반도체 뭐 그리고 뭐 신약 뭐 여러
22:52
가지들이 지금 어떻게 보면은 어떤
22:55
소재 영역에서의 그 한계점에 지금
22:58
봉착하고 있잖아요 그래서 저희가 뭐
23:00
구조라든가 어떤 아이디어라 그가 뭐
23:02
예를 들면 소프트웨어라 그가 뭐 이런
23:04
것들이 이제 막 융합시켜 가지고 지금
23:06
만들고 있잖아요 근데 이게 되게 뭐랄
23:08
랄까요 그 원초적인 영역에서 마구마구
23:10
막 그 진짜 도자기 꼽는 그 영역에서
23:13
이렇게 AI 엄청난 그 데이터를
23:16
학습해 가지고 새로운 애들을 발견하고
23:18
또 그거를 로보틱스란 연결 해 가지고
23:20
진짜 실험까지 해버리니까 무섭네요
23:22
한편으로는 어떻게 보면은 전문 영양이
23:25
있던 사람들 많이 할 수 있는
23:26
일이기도 했는데 그 부분을 싹 다
23:29
바꿔 버리니까 약간 위기감을 느끼실
23:31
분들도 있으실 것 같은 어떻게 보면
23:33
과학을 접근하는 방식 자체가
23:35
바뀌었다고 보시면 될 거 같아요 진짜
23:37
새로운 시대가 열릴 것 같은데이 그놈
23:39
데이터 열려 있죠 지금네 열려
23:40
있습니다 여러분들 다 보실 수 있고요
23:42
아 오늘 이렇게 진짜 여러모로 핫한
23:45
소식 정말 재밌는 소식 진짜
23:46
이거야말로 과학과 공학이 콜라보해야
23:49
되는 주제가 아닌가 싶었는데요 정말
23:51
가슴뜨거운 주제를 가져와주신 에러 님
23:53
정말 감사합니다네 저도 오늘 처음으로
23:55
드디어 안될 과학의 콜라보를 명목으로
23:58
어 재밌는 내용 한번 소개를 해
23:59
드렸는데요 요런 소식뿐만이 아니라 어
24:02
향후에도 안 될과 할까 여러분들에게
24:04
좀 유익한 내용이 있으면은 저도
24:06
열심히 준비해서 또 한 번 교수님들
24:07
찾아뵙도록 하겠습니다네 감사합니다
24:09
지금까지 안될 거 학 약 안될 공학
24:13
에러였다

728x90
반응형
LIST