본문 바로가기

카테고리 없음

초거대 AI의 미래 인공지능과 고전학 연구 [AI가 내려온다: 인공 지능 시대의 고전 문학 연구]

728x90
반응형
SMALL

AI가 내려온다: 인공 지능 시대의 고전 문학 연구

 

인공 지능 시대의 고전 문학 연구

AI가 내려온다

AI라는 호랑이 등에 올라타고 고전 문학을 종횡무진 내달린 강우규, 김바로 두 인문학자


AI의 시대는 융합의 시대.

고전 문학 연구의 미래가 여기에 있다!

 

2022년 8월, 콜로라도 주립 미술 대회의 디지털아트 부문에서 제이슨 앨런(Jason Allen)의 「스페이스 오페라 극장(Theatre D'opera Spatial)」이 1위에 올랐다. 별로 특별하지 않아 보이는 이 이야기가 화제가 된 것은, 이 그림이 텍스트로 된 설명문을 몇 초 만에 이미지로 바꾸어 주는 인공 지능(artificial intelligence, AI) 프로그램 미드저니(MidJourney)가 그렸다는 사실이 밝혀지면서부터였다.

 

이처럼 AI가 ‘마인드 스포츠(mind sports)’ 최후의 보루였던 바둑을 제패한 2016년 ‘알파고 쇼크’ 이후 운전, 번역, 심지어 문학과 예술까지 인간만의 영역이라 여겨졌던 분야를 향한 AI의 진격이 최근 몇 년간 이어지고 있으며, 그 끝이 유토피아일지, 디스토피아일지는 아직 알 수 없는 상황이다.

 

이런 상황에서 AI라는 호랑이의 등에 용감하게 올라타, 고전 문학의 첩첩산중을 내달린 두 인문학자가 있다. 바로 강우규 중앙대학교 교수와 김바로 한국학중앙연구원 연구원이 그 주인공이다. 이번에 ㈜사이언스북스 신간으로 출간된 『AI가 내려온다: 인공 지능 시대의 고전 문학 연구』는 두 저자가 디지털 분석의 방법론을 실제 사례에 적용해, 고전 문학 작품에 대한 새로운 연구 가능성을 제시한 「AI 인문학 시리즈」의 네 번째 책이다.

 

 

고전 소설 「소현성록」과 「구운몽」에 대한

AI 디지털 분석이 보여 주는 인문학의 미래

 

이 책은 두 저자가 중앙대학교 HK+인공지능인문학사업단의 HK 연구 교수로서, 인공 지능 시대가 도래하면서 가능해진 새로운 방법론으로 고전 소설을 분석한 기록이다. 주된 분석 대상이 된 텍스트는 17세기 국문 소설인 「소현성록」 연작과 「구운몽」으로, 「소현성록」 연작은 중세 중국을 배경으로 소현성과 그 부인들의 이야기가 주를 이루는 본전 「소현성록」과 소현성의 여러 아들과 그 부인들의 이야기가 주를 이루는 별전 「소씨삼대록」으로 구성되어 국문 장편 소설의 효시로 불리는 작자 미상의 작품이다. 「구운몽」은 현실 세계의 젊은 승려 성진이 하룻밤 꿈속에서 주인공 양소유로 분해 겪는 팔선녀와의 연애와 성공담을 통해 진정한 삶이란 무엇인가를 묻는, 17세기 소설사를 대표하는 서포 김만중의 국문 소설이다.

 

두 저자는 2018년 당시 학계에서는 생소하게만 여겨졌던 고전 문학과 디지털 인문학의 융합을 위해 두 작품의 인문 데이터를 처음부터 구축하고, 형태소 분석, 계층 분석, 감정 분석, 사회 네트워크 분석, 딥러닝 분석 등의 다채로운 기법을 최적화해 디지털 분석을 진행했다.

 

 

역사 속 숨겨진 「소현성록」 연작의 저자를 찾는 모험:

디지털 문체 분석과 고전 문학

 

궁극적으로는 0과 1로 세상을 인식하는 컴퓨터가 어떻게 사람의 특징적인 문체를 판별할 수 있을까? 우선 컴퓨터가 문체적인 특징을 형태로 인지한다는 사실을 이해해야 한다. 예를 들어 우리가 텍스트에서 “이순신”을 검색하면 그 결과를 얻지만, 의미상으로 거의 동일하지만 형태가 다른 “충무공”은 검색이 되지 않는다. 이처럼 컴퓨터는 맥락을 파악하는 데는 매우 취약하지만 특정 형태가 전체 문장에서 몇 번 등장했는지는 빠르고 정확하게 처리할 수 있다.

 

그렇기에 컴퓨터로 진행하는 기본적인 문체 판별은 텍스트에서 특정 형태들의 등장 빈도를 상호 비교하는 통계적 방식으로 이루어진다. 특정 텍스트에 ‘엇디’가 많이 나오고, 다른 텍스트에서도 ‘엇디’가 많이 나온다면 두 텍스트는 서로 유사할 가능성이 크다. 사실 이런 작업 자체는 연구자도 수행할 수 있다. 다만 컴퓨터보다 엄청나게 오랜 시간이 걸릴 뿐이다. 최근에는 특정 형태가 다른 형태와 이루는 조합이나 동일한 의미를 갖는 다른 형태에 대해서도 정확한 분석을 수행하기 위해 인간의 뇌를 모방해 내재적인 유사 의미를 유추하는 딥러닝(deep learning) 방식을 사용하고 있다.

 

2장 ‘디지털 문체 분석과 고전 문학’에서 두 저자는 기본적인 형태를 통계적으로 분석하는 방식과 딥러닝 방식 두 가지 모두를 통해 고전 소설을 연구했다. 먼저 「소현성록」 연작을 대상으로 통계적 분석을 거쳐 그동안 베일 속에 감추어져 있던 저자의 정체를 확인하는 작업에 한 걸음 더 나아갔으며, 크게 다섯 종류가 존재하는 「소현성록」 연작 판본 간의 상관관계 및 변이 양상을 파악하는 시도를 했다. 딥러닝 방식으로는 경판 방각본 고전 소설을 대상으로 고전 소설의 유형을 탐색했다.

 

 

숲을 보면서 나무도 놓치지 않기:

디지털 감정 분석과 고전 문학

 

인간처럼 자연적으로 감정을 인지하지 못하는 컴퓨터는 감정 사전(sentiment lexicon)을 토대로 감정을 인지한다. 감정 사전은 ‘눈물’을 ‘슬픔’ 혹은 ‘부정’이라는 감정이라고 서술하고, ‘웃음’은 ‘기쁨’ 혹은 ‘긍정’이라는 감정과 대응시키는 식으로 특정 형태소와 감정을 짝지어 정리한 목록이다.

 

그런데 이 방법에는 맥락을 파악하지 못하는 문제가 있다. 이를 해결하기 위해 최근에는 문장의 맥락까지 반영하는 딥러닝 방법이 사용되고 있다. 딥러닝 방법에는 문장과 그 문장의 감정을 라벨링 한 빅 데이터가 필수적으로 요구되는데, 아직 현대 한국어에 대한 감정 데이터조차 부족한 상황이고 제대로 된 한국어 기반 디지털 감정 사전도 공개된 것이 없다.

 

3장 ‘디지털 감정 분석과 고전 문학’에서 두 저자는 이런 상황에서 고전 문학 작품의 디지털 감정 분석을 위해 1) 영어로 된 빅 데이터 기반 감정 사전을 사용하는 방법과 2) 설문 조사 방식을 통해 고전 문학 작품에 나타난 감정을 수동으로 입력, 빅 데이터보다 정교한 스몰 데이터(small data)를 구축해 분석하는 두 가지 제안을 제시했다. 영어 감정 사전 기반 빅 데이터 감정 분석 방식으로는 「소현성록」 연작을, 스몰 데이터를 구축하는 방식으로는 「구운몽」의 감정을 각각 분석했다.

 

 

융합 연구를 꿈꾸는

미래의 디지털 인문학자들을 위해

 

연구 결과는 연구라는 첩첩산중을 구르고 넘어지고 좌절하는 수많은 과정에서 겨우 건져 낸 아름다운 풍광이다. 그 연구 과정 대부분은 아름답지 않지만, 그 결과 때문에 미화되고는 한다. 마지막 4장 ‘AI라는 범을 어떻게 다룰 것인가?’에서 두 저자는 진솔한 대담을 나누며 고전 문학과 디지털 인문학의 융합에서의 발생하는 현실적인 어려움이 무엇인지를 이야기한다.

 

하나는 분석을 위한 인문 데이터의 구축이고, 다른 하나는 분석 결과를 이해할 수 있도록 인문학계에 설명하는 일이다. 후자의 문제는 노력을 들이면 해결 가능하다. 비록 새로운 방법론이라도 인문 텍스트 자체는 인문학자들이 평생을 보아 온 것이기 때문이다. 데이터에 익숙하지 않고, 디지털 분석 결과를 해석할 능력이 약한 인문학자에게는 오히려 인문 데이터의 구축이 더 큰 문제라는 것이다.

 

이를 극복할 방안으로 그들이 제시하는 것은 인문 데이터를 구축하는 기초 연구 사업의 지속적 확대 운영이다. 이와 함께 한 가지 주제에 어떠한 분석 기술을 활용 가능한지를 인문학자도 쉽게 이해할 수 있도록 서술한 『AI가 내려온다』 같은 책을 꾸준히 만들어, 익숙함에 안주하지 않고 새로운 것에 도전하는 용기를 가진 자신 같은 연구자들이 계속 나타날 수 있도록 하겠다는 것이 또 한 가지의 해법이자 두 저자의 다짐이다.

 

현 단계에서의 고전 문학과 디지털 인문학의 융합 연구는 기존 연구에서 논의된 내용을 통계적 수치를 통해 객관적으로 증명하게 된다. 새로운 방법론이 고전 문학 연구에서 유의미하다는 점을 보여 주어야 했기 때문이다. 그런데 온갖 수치와 그림을 통해 어렵게 증명한 융합 연구의 결과가 기존의 고전 문학 연구와 큰 차이가 없었기 때문에, 굳이 생소하고 어려운 연구를 수행할 이유를 찾지 못했을 것이다. 하지만 기존과는 완전히 다른 방식으로 기존의 연구와 유사한 결과가 나온다는 것 자체가 무서운 일이라고 생각한다. 새로운 방식에서는 명확한 근거와 재현성을 제공해 주기 때문이다. 현재는 기존 학설을 다른 방식으로 탐색하고 있지만, 새로운 연구 방법의 정합성이 인정된 이후에는 디지털 분석을 통해 도출된 전통적인 연구 결과와 상이한 지점에 대해서도 접근을 시도할 것이다. 그리고 이러한 지점들은 곧 인간과 컴퓨터의 융합으로만 볼 수 있는 새로운 지평이 될 것이다.


―「책을 시작하며」에서

 


차례

 

책을 시작하며: 고전 문학과 디지털 인문학의 만남 5

1강 프롤로그: 인공 지능이 내려온다 11

2강 디지털 문체 분석과 고전 문학 27

3강 디지털 감정 분석과 고전 문학 95

4강 에필로그: AI라는 범을 어떻게 다룰 것인가? 159

후주 171

찾아보기 175


 

저자 소개

강우규

중앙대학교 HK+인공지능인문학사업단 HK 연구 교수이다. 중앙 대학교 국어 국문학과를 졸업하고, 같은 대학교 대학원에서 문학 박사 학위를 받았다. 현대의 대중 서사인 웹툰, 드라마, 영화 등의 문화 콘텐츠에 대한 관심을 가지고 연구를 진행하고 있고, 고전 서사의 텍스트 한정성 문제를 극복하기 위하여 인공 지능을 활용하는 융합 연구를 진행하고 있다. 논문으로는 「디지털 맵핑(Mapping)을 활용한 구운몽 연구 및 교육적 활용」, 「바리 이야기의 웹툰 수용 양상과

의미 고찰」, 「딥러닝을 활용한 경판 방각본 소설의 유형 고찰」 등이 있다.

 

김바로

중앙대학교 HK+인공지능인문학사업단 HK 연구 교수. 중국 베이징 대학교 역사학과를 졸업하고, 같은 대학교 대학원에서 민족사 전공으로 석사 학위를 받았다. 한국학중앙연구원 한국학대학원 인문정보학 전공으로 박사 학위를 취득했다. “안 될 것을 알면서도 행하려고 하는 사람(知其不可而爲之者)”을 가슴에 새기고, 디지털 기술과 인문학의 융합 개념인 ‘디지털 인문학’을 끈덕지게 추구하고 있다. 저서로는 『디지털 인문학 입문』, 『시맨틱 데이터 아카이브의 구축과

활용』 등이 있다.

 

초거대 AI의 미래 인공지능과 고전학 연구

 

이 글은 최근 챗GPT를 비롯한 다양한 AI가 등장하면서 일어난 교육과 연구 현장의 변화, 그리고 직접 여러 AI 프로그램을 사용해본 경험을 고전학 연구자의 입장에서 정리한 것이다. 이를 통해 향후 고전학 연구자가 AI와 동행을 할 때 주의할 점과 향후의 과제 등을 밝히고 있다.

GPT에서 시작된 AI와의 전면적 대면

2022년 연말에 Openai사의 챗GPT3.5가 공개되면서 모두 놀라움과 두려움을 느꼈다. 2016년 구글 딥마인드(Google DeepMind)가 만든 인공지능 바둑프로그램 알파고(AlphaGo)가 이세돌 9단을 이겼을 때와는 전혀 다른 충격이다. 알파고가 바둑에 국한된 것이기에 우리와는 떨어져 있다고 생각했다면, 이번에는 교육과 연구에 직접 영향을 줄 수 있다. 챗GPT에 앞서 2022년 9월 미국 콜로라도 주립박람회에서 디지털 ART 부분 우승작으로 선정된 작품 “스파이스 오페라 극장”이 미드저니(Midjourney)라는 AI 프로그램으로 만든 것임이 알려지면서 논란이 되었다. 이 프로그램으로 만들어진 작품을 창작품으로 인정할지 논란과 함께 향후 창작의 영역까지 AI가 중요한 역할을 할 수 있다는 점에서 충격은 상당했다. AI의 외국어 번역기는 이미 많은 영역에서 활용되고 있고 관련 논의도 상당히 진척되었다. 따라서 현재 드러나는 AI의 모습은 이미 예견된 것이라고 할 수 있다.

 

챗GPT가 일반인의 관심을 끈 이후 관련 업계에서는 구글의 ‘Bard’, 아마존의 ‘Bedrock’, 중국 바이두의 ‘文心一言’이나 알리바바의 ‘通義千問’을 포함하여 각종 AI 관련 프로그램이 경쟁적으로 쏟아져 나오고 있다. 생성형 AI에 대한 설명이나 동영상도 계속 새롭게 등장하고 있다. 개론적인 설명부터 복잡한 사용법, 미래 사회의 변화 가능성, 한계와 문제점 등 다양한 논의가 나왔다. 대학에서 권장하는 곳과 금지하는 곳, 그리고 활용 가이드라인을 제정한 곳도 있다. 지금의 속도로 AI가 발전하는 것에 대한 두려움과 경계로 일정 기간 지금보다 더 발전된 AI의 개발을 중지하자는 제안도 나왔다. 개발 자체를 중지하자는 제안은 낭만적으로 보이는데, 일부 경쟁 업체는 좋아할 수 있지만 지금의 신기술 개발 전쟁에서 받아들여질 가능성은 거의 없다.

 

이제 AI의 등장을 두려워하거나 걱정만 할 것은 아니며 인간을 도와주는 유용한 도구로 활용하는 것을 적극적으로 모색해야 한다. 즉, 본격적으로 인간과 AI의 동행의 시대가 되었다. 세상의 흐름은 AI의 사용을 당연한 것으로 받아들이고 있고 이를 경계한다고 해서 없어지는 것이 아니다. 적극적으로 AI의 장단점을 파악하고 이와 동행하여 미래 지향적인 우리의 학술연구와 교육에 유용한 도구가 되도록 해야 한다.

 

고전 한문의 번역에서 만난 AI 번역기

AI와 관련하여 나의 관심사는 향후 우리의 연구와 교육에서 어떻게 활용한 것인가이다. 특히 고전 한문의 우리말 번역에 이용 가능한지에 대한 것이다. 이미 중국에서 개발된 광학식 문자판독기(OCR, Optical Character Reader)나 자료화된 텍스트의 처리에 대한 다양한 프로그램이 상당한 수준까지 개발된 상태이다. 고전 한문의 번역에 이용할 수 있는 AI 프로그램은 챗GPT, DeepL, baidu번역기, 구글번역기, 파파고번역기 등이 있다. 기본적으로 인공신경망의 딥 러닝(Deep Learning)을 이용한 것들인데, 채팅 기반의 생성형 AI인 챗GPT 역시 번역 기능이 포함되어 있다.

 

영어를 비롯한 주요 외국어는 AI 번역에서 상당한 정확성을 갖고 있고, 현대중국어의 우리말 번역 역시 이미 상당 수준까지 발전하였다. 고전 한문의 우리말 번역 정확도가 높다면 학문의 발전에 획기적인 전환점이 될 수 있다.

나는 고전 한문 번역기를 이용할 때 먼저 원문에 표점을 해주는 프로그램인 古詩文斷句(https://seg.shenshen.wiki/)라는 프로그램을 이용한다. 한자로 쓰인 고전 한문을 중국어의 하나로 인식할 것이기에 중국의 표준적인 표점에 근거하여 번역할 문장을 제시하는 것이다. “한문 원문 → 한국어”, “한문 원문 → 영어 → 한국어”, “한문 원문 → 현대중국어 → 영어 → 한국어” 번역의 방법을 썼을 때를 비교해보았는데, 아직 큰 차이를 발견하지 못했다.

 

AI 번역기의 번역 품질에 대한 기존의 논문에서는 ‘단어’, ‘구’, ‘문장’ 단위의 오류를 나누어 분석하는 경우가 많았다. 가령 번역기에서 귀족계급을 뜻하는 ‘大夫’를 ‘의사’라고 번역한 것이 보이는데, 이는 현대중국어 ‘大夫’가 ‘의사’를 뜻하기에 생긴 단어 번역의 오류이다. 이는 아주 오랜 시간이 걸리지 않고 쉽게 개선될 것이다. 『맹자』에 나오는 “上下交征利”라는 구절은 번역기에서 정확한 번역이 되지 않는데, 이는 전후 문맥에 의한 논리가 개입되어 있어서 앞으로도 많은 자료의 학습이 이루어져야만 가능할 것이다. 한문의 번역 단위가 커질수록 전체의 논리를 이해하기 어려워 번역상 오류가 적지 않다.

 

또 우리말 번역문을 제시하지 않고 원문을 그대로 쓰는 ‘복사모델(Copy Model)’도 자주 보인다. 복사모델은 빈도수가 낮거나 코퍼스에 등장하지 않은 단어가 처리하기 어려워 해석이 되지 않는 단어가 나올 때 그냥 원래의 입력 언어를 그대로 출력하는 방법을 가리킨다. 복사모델이 자주 나온다는 것은 아직 학습한 데이터가 부족하다는 것을 의미한다. 또 기존의 번역서와 다른 번역어가 간혹 보이는데, 이는 습관적으로 해오던 번역과 다른 좀 더 친근한 번역어를 찾을 때 도움이 될 수 있을 것으로 보인다. 결론적으로 고전 한문의 번역에서 AI 번역기는 오류가 적지 않아서 아직 초보적인 수준으로 보인다. 경제적인 효과 때문에 이 부분에 대한 투자가 상대적으로 적었기 때문이라고 생각되지만, 이 또한 시간의 문제일 뿐이다.

 

멀티모달 AI의 등장과 활용

‘멀티모달’은 ‘멀티 모달리티(multi modality)’의 약자이다. ‘모달리티’는 ‘mode’와 같이 ‘양식’, ‘방식’을 뜻한다. ‘멀티 모달’은 시각, 청각을 비롯한 여러 인터페이스를 통해 정보를 주고받는 것을 말하는 개념이다. 내가 멀티모달 AI 중 그림을 그려주는 것에 관심이 있는 것은, 논문이나 저서를 쓸 때 필요한 삽화나 그림에 대한 기대 때문이다. 미드저니, 스테이블 AI, Dall-E2 등에 이 기능이 있다. 채팅으로 그림을 요청하고 AI가 적당한 이미지를 그려주면 사용자가 이를 다시 수정해 달라고 명령어를 내려 점차 필요에 맞추어 간다.

가령, 아래는 Dall-E2를 이용하여 공자가 그의 논어책을 가지고 책상에 앉아 있는 그림을 그려달라고 요청을 한 후 수정 과정을 거쳐 얻어낸 결과물이다.

<그림2> Dall-E2의 공자 그림

 

나는 아직 이 프로그램의 이용법에 대해 초보자 수준이다. 그렇지만 향후 이미지를 그려주는 AI가 더 발달하고 이를 잘 활용하면 저술에 필요한 삽화를 얻을 수 있을 것이라는 믿음을 확인할 수 있었다. 음악을 만들어주는 AI까지 활용 가능하다면, 문헌 관련 연구나 저술의 내용을 일반인 대상 동영상으로 제작하는 것도 충분히 가능할 것으로 보인다. 이렇게 만들어진 이미지나 동영상이 저작권이 없이 공개되므로 사용상의 제약이 없다는 점도 장점일 수 있다.

GPT와 대화하기

챗GPT는 대화형, 생성형 AI이다. 과거의 검색프로그램은 관련 내용이 들어있는 사이트를 알려주는 것이라면 챗GPT는 관련 내용을 스스로 조합해서 문장으로 만들어준다. 이 때문에 보고서를 써주거나 문장을 요약하는 것 등에서 상당한 강점이 있다. 최근에는 excel이나 ppt까지 만들어주기 때문에 사무실의 근무 인원을 대폭 줄여줄 수 있을 것이라는 기대도 있다. 인간의 일이 없어진다는 점에서 부정적이지만, 개인의 비서가 한 명 생겼다고 생각하면 긍정적이다.

 

현재로서 챗GPT가 문헌 연구에 직접적으로 유용한 도움을 줄 것이라고 기대하기 어렵다. 다만 몇 가지 영역에서는 상당히 유용한 도움을 준다. 가령, “학부생 수준의 맹자 강의를 위한 15주 강의계획서”와 “현대 사회에서 공자 사상이 갖는 장단점에 대한 보고서”를 요구했을 때 짧은 시간에 상당한 수준의 결과물을 받아볼 수 있었다. 물론 생성형 AI의 특성상 사용자가 요구한 질문에 답변하기 때문에 전혀 현실에 없는 문제를 던졌을 때 사실이 아닌 답변을 내놓은 경우가 있다. 이는 우리가 챗GPT를 적절하게 사용하고 검증 가능해야 함을 알려준다. 즉, 답변 내용을 맹목적으로 믿으면 차후에 오히려 곤란해지는 경우가 발생한다는 것이다.

 

가령, 실제 챗GPT와 가진 유교 경전 연구의 미래 가치에 대해 행한 대화에서, 챗GPT는 처음 “윤리적 지침, 문화적 이해, 교육적 가치, 사회적 조화” 등의 항목을 나누어 잘 설명해 주었다. 하지만 대화를 이어가면서 조선 시대 경학 중 여성 경학에 대한 연구가 중요해질 것이라는 대목에서 잘못된 정보를 제시하기 시작했다. 역사에 없는 사람의 이름을 들먹이면서 그들이 어떤 사람이고 왜 중요한 지 등을 언급하기까지 하였다. 마지막에 이에 대해 지적하자 “저의 부적절한 대답으로 인해 혼란을 드려 대단히 죄송합니다.”라는 사과를 했다.

 

질문자가 답변을 들은 후 스스로 답변의 옳고 그름을 파악할 수 없다면 챗GPT의 답변은 잘못된 정보를 주는 부정적 역할을 하게 되어 사용자를 곤란에 빠뜨릴 위험이 있다. 사용자는 ‘환각’, ‘개소리’ 등으로 부르는 이런 답변이 적지 않게 나온다는 사실을 잊어서는 안 된다. 따라서 챗GPT 활용에 있어서는 반드시 다음의 전제가 필요하다. 첫째는 사용자가 올바른 질문을 할 수 있느냐이고, 둘째는 답변의 타당성을 스스로 사유하고 재질문할 수 있느냐이다. 이것이 전제되지 않는다면 챗GPT는 악영향을 미칠 가능성이 크다. 또한 앞으로 교육에 있어서 정확하게 질문하는 능력, 문제를 찾아내는 능력에 주안점을 두는 것이 중요하다는 점을 생각하게 한다.

 

교육 현장에서 AI 활용하기

챗GPT 등장은 글쓰기 중요성을 강조해온 인문학 분야의 교육에 큰 고민을 던져주었다. 학생들이 챗GPT를 사용하여 보고서를 썼을 경우 이를 확인할 마땅한 장치가 없는 상태에서 자칫 학생들이 스스로 사유해서 써내야 할 보고서를 챗GPT에 의존하면 원래의 교육 목적을 달성하기 어려워질 것에 대한 우려에서 나온 것이다. 이 때문에 대학 차원에서 챗GPT 사용 자체를 금지하는 곳이 있고 교수들 역시 이에 동참하였다. 또 AI 도움을 받을 수 없도록 수업 중 보고서 부과 자체를 없애고 교실 현장에서 직접 논술형 시험을 보는 방법을 취하자는 의견도 있다. 반면에 적극적으로 챗GPT 사용을 권장하거나 챗GPT 사용에 대한 가이드라인을 제정하는 대학과 교수들도 있다.

 

챗GPT로 인한 고민에서 나 역시 자유롭지 않다. 나는 AI와의 적극적인 동행을 강조한다. 2023년 1학기 수업에서 챗GPT를 비롯한 다양한 AI의 적극적 사용을 권장하면서 다음과 같이 제시하였다. “수강생 발표문 및 보고서 작성 중에 챗GPT나 DeepL 등의 번역기를 비롯한 일체의 AI 사용 허용. 단 활용 여부를 밝히되 AI의 오류를 극복할 수 있는 수준이어야 할 것임.” 아직 중간보고서 및 수강생 발표가 이루어지지 않아서 결과를 알 수 없다. 하지만 수강생을 불신한 전제에서 윤리서약서를 받거나 AI 사용 금지를 하는 것보다 학생들의 반응이 좋은 것으로 판단하고 있다.

 

또 『맹자』 텍스트의 강독을 하는 교과목에서는 개강 첫 시간 수업 중에 앞서 언급한 5종 AI 번역기의 맹자 구절 번역 결과를 학생들과 토론해 보았다. 시험 문항 중에 고전 한문 원문에 대한 AI 번역기의 번역문을 보여주고 어떤 부분이 왜 틀렸는지를 설명하는 문항을 출제하기로 하였다. AI 번역기의 발전 속도를 볼 때 현대중국어에 비하여 고전 한문은 상대적으로 AI 번역의 오류가 없어질 때까지 아직 더 많은 시간이 소요될 것으로 보이지만, 이 또한 시간의 문제일 뿐이다. 또한 갈수록 고전 한문에 대한 관심이 줄어들고 있는 젊은 세대의 특성을 고려하여 고전 한문을 AI와 연계시켜 강의에 활용하는 것이 수강생의 관심을 끌기에 효과적일 수 있다는 판단도 든다.

 

AI와의 동행에서 주의할 점

앞에서 고전 연구자로서 AI와 어떻게 동행을 꾀하고 있는지에 대해 언급하였다. 이미 시작된 디지털 대전환 시대를 피할 수 없다면, 적극적으로 활용하여 우리의 학문 연구와 교육에 도움이 되도록 만들어야 한다. 이때 아래의 몇 가지 점에 대해서는 깊은 생각이 필요하다.

 

첫째, 챗GPT를 우리의 생산성을 높이는 도구로써 활용하려면 우리가 챗GPT보다 더 똑똑해야 한다. AI는 인터넷으로 학습한 자료에 근거하기 때문에 인터넷에 있는 자료만큼의 편향성이 있으며 객관적으로 증명될 수 없는 내용이 다수 포함된다. 따라서 사용자가 스스로 검증하는 것은 필수적이다. 잘 모르는 분야에 이용할 때의 위험성을 고려한다면 자신이 잘 아는 분야에 활용해서 자신의 시간을 덜어주는 역할을 하도록 해야 한다.

 

둘째, 교육 현장에서 챗GPT 등 AI 사용을 금지하기보다 교육 방법을 혁신하는 노력이 필요하다. 인문학은 비판력, 상상력, 창의력을 길러주는 학문인데, 지금까지 대부분의 교육은 문헌 해독 중심이었다. 인터넷의 등장 이후에도 문헌의 해독을 통해 과거 지식을 탐구하는 방식이 갖는 장점은 여전히 유효하다. 이제 여기에 더해 스스로 학습한 지식에 근거하여 새로운 정보가 믿을만한지 검증해볼 수 있는 능력, 정보를 비판하고 더 나아가 새롭게 사유할 수 있는 능력을 배양해야 한다. 학생들이 챗GPT를 사용하여 표절할 것이라는 염려는 결국 표절이 가능한 과제의 부여 방식에도 기인한다는 비판을 겸허하게 받아들여야 한다. 더구나 앞으로 현재의 표절 개념 자체에 변화가 올 가능성도 크다. AI의 등장은 앞으로 자신이 쓰는 글에 들어갈 정보 하나하나에 모두 주석을 달아야 하는 방식에 변화가 불가피하다. 그래서 이제 정보 자체가 아니라 그 정보를 어떻게 받아들이고 어떻게 새롭게 재해석할 것인지를 교육하고 연구해야 한다는 것이다.

 

셋째, 자신의 전공 영역의 학습과 연구를 제대로 하는 것이 중요하다. 연구와 교육 모든 면에서 진정으로 진검승부의 시대가 왔다. 과거에는 재주가 없음에도 있는 것처럼 속여도 살아남을 수 있었던 ‘남우충수(藍芋充數)’가 가능했다면, 이제는 진정으로 자신만의 실력이 없으면 살아남을 수 없게 되었다. 가까이에 있는 연구자와 경쟁을 하던 것에서 이제는 전 세계의 모든 지식 세계와 경쟁을 하는 시대가 되었다. 연구뿐만 아니라 교육에서도 학생들의 수준을 정확하게 파악하고 그에 맞는 교육 방식을 찾아야 하며, AI에 의존한 학생들의 보고서 등에 대해 명확하게 그 한계를 인식하고 지도해야 한다. 이것은 우리의 학문에 대한 도전이면서 동시에 기회라고 볼 수 있다.

넷째, 고전 연구자의 역할에 대한 적극적인 모색과 참여가 필요하다. 번역기를 비롯한 각종 AI 프로그램이 고전 한문을 대상으로 연구하는 학문 영역에 대해 아직 미진한 면이 있는 것이 사실이다. 그렇지만 AI의 지식 범주가 고전 한문까지 넓어지는 것은 이미 시작되었다. 따라서 급속하게 발전하는 AI의 올바른 활용과 함께 미래 AI 발전에 고전 연구자는 공헌할 것이 무엇인지를 생각해야 한다. 번역 프로그램의 경우에도 고전 문헌에 특화된 프로그램 개발에 일정 정도 역할을 하는 것이 가능할 것이다.

 

다섯째, 향후 다가올 정보와 언어의 비대칭에 주의해야 한다. AI 번역기의 발달은 외국어 학습의 부담을 줄여줄 것이라는 기대를 하고 있지만, 그와 다른 측면에서 챗GPT의 공개 이후 영어의 중요성은 더욱 커지고 있다. 이는 전 세계적으로 정보를 담고 있는 언어의 비대칭에서 생기는 현상인데 딥러닝의 특색에 의해 더 많은 검색이 다시 정보로 축적됨에 따라 비대칭은 시간이 지날수록 더욱 가속화될 것이다. 이는 학문 영역에서 영어에 대한 종속의 심화를 말하는 것이며 궁극적으로 우리말로 학문하기에 대한 도전이기도 하다. 그러므로 자칫 세계 보편의 학문이라는 명분 속에서 우리의 독자적 학문 영역의 축소에 이르지 않도록 다방면의 노력이 필요하다고 할 것이다.

728x90
반응형
LIST