아이티랩 - MS 클라우드 ‘애저’, 한국 문학 연구 도우미로

애저 클라우드가 한국 문학 연구에 새로운 빛을 밝히는 데 도움을 주고 있다. 한국의 문학 유산 전승을 돕는 ‘문(Mo文oN)’ 프로젝트가 마이크로소프트 애저 클라우드에서 구축을 시작했다.

기존 고서 및 근·현대 문학 자료는 디지털화가 활발히 진행돼 있지 않았다. 이런 문제 때문에 연구학자는 폭넓은 연구를 진행할 수 없어 불편을 겪고 있었다. 국회도서관에서 자료의 디지털화를 진행하기는 했으나, 이미지 형태로 변환하는 스캔 방식이라 검색을 할 수 없어 제대로 활용하기가 힘들었다.

20여년 간 한국 문학을 연구해온 웨인 드 프레메리 서강대학교 국제한국학과 교수는 이런 어려움을 개선하고자 고문서와 자료의 글자를 인식하는 프로그램을 만들어 문 프로젝트를 기획했다. 그리고 올해 2월 마이크로소프트가 필란트로피즈 활동의 하나로 발표한 ‘클라우드 포 굿‘ 지원 프로그램에 9개 프로젝트 중 하나로 선정되면서, 문 프로젝트를 애저 클라우드에서 구축할 기회가 생겼다. 마이크로소프트 애저가 제공하는 고급 분석, 머신러닝, 인공지능을 개발에 활용할 수도 있게 됐다.

쉽고 빠른 검색으로 연구에 드는 시간 줄여

문 프로젝트는 기존에 검색할 수 없던 스캔 이미지 형태의 PDF가 가진 한계를 극복해 한글은 물론 20세기 이전의 근대 국어, 한문에 이르기까지 서체에 상관없이 모든 텍스트를 손쉽게 검색할 수 있게 했다.

googletag.cmd.push(function() { googletag.defineSlot('/6357468/0.Mobile_Article_intext_1_300_250', [300, 250], 'div-gpt-ad-1468307418602-0').addService(googletag.pubads());googletag.pubads().collapseEmptyDivs();googletag.pubads().enableSyncRendering();googletag.enableServices();googletag.display('div-gpt-ad-1468307418602-0'); });
‘문(Mo文oN)’ 프로젝트를 통해 김소월 시인의 '진달래꽃' 글자를 이미지로 캡처하는 모습

‘문(Mo文oN)’ 프로젝트를 통해 김소월 시인의 시집 ‘진달래꽃’에서 한자 ‘뫼 산(山)’을 검색한 결과

김소월의 시 ‘진달래꽃’을 살펴보자. 이 시에 ‘사뿐히 즈려 밟고 가시옵소서’라는 문구가 나온다. 여기에서 ‘즈려 밟고’에 대한 해석은 아직도 분분하다. 현대 국어에는 없는 표현이기 때문이다. 이 표현의 제대로 된 의미를 알기 위해서는 다른 시집이나 수많은 자료를 통해 이 표현이 쓰인 문맥을 찾아 분석해야 한다. 하지만 한 사람이 수천, 수만 페이지에 이르는 문서를 일일이 확인하기에는 어려움이 있다. 문 프로젝트는 자료의 데이터화로 쉽고 정확한 검색을 할 수 있게 해 고문서의 활용도를 높이고 연구에 드는 시간을 줄인다.

텍스트를 3D로 재해석해 문학으로의 색다른 접근법 제시

문 프로젝트는 시의 구절을 3D 형태로 제작할 수 있는 기능도 포함하고 있다. 예를 들어 시 ‘진달래꽃’을 이루고 있는 한글 자모, 한자 획, 띄어쓰기 등에 각각의 코드를 매길 수 있다. 이렇게 나온 코드를 3D 프린터로 출력하면 각각의 값에 따라서 텍스트였던 시가 새로운 조형물로 탄생하게 된다. 목걸이나 반지 같은 악세사리로도 만들 수 있고 인테리어 소품처럼 재현될 수도 있다.

(Mo文oN)’ 프로젝트 조형물. 조형물의 모양은 시마다 다른 형태로 재현될 수 있다.

3D 모델로 재해석한 ‘문(Mo文oN)’ 프로젝트 조형물. 조형물의 모양은 시마다 다른 형태로 재현될 수 있다.

문 프로젝트로 ‘홀로렌즈’와 같은 혼합현실(MR) 기기로 학생이나 일반인들이 직접 체험할 수 있는 3D 교육 공간도 만들 수 있다. 이 같은 문학의 3D 재해석엔 한국인들이 고전과 시문학에 더 많은 관심을 가질 수 있도록 돕고자 하는 웨인 교수의 바람이 담겨 있다.

한국 문학 연구 위한 공유플랫폼

문 프로젝트는 국회도서관과의 협력으로 많은 양의 고문서와 근·현대 문학 자료를 데이터화해 누구나 어디서든 자유롭게 연구할 수 있는 공유 플랫폼을 구축하고자 한다. 아직은 시작 단계이지만, 문 프로젝트가 정식으로 출범하면 불필요한 시간을 줄여 연구에 더욱 집중할 수 있는 환경을 만들고 고문서 연구 범위를 확장할 수 있을 것으로 기대된다.

서강대 웨인 드 프레메리 교수

서강대 웨인 드 프레메리 교수

웨인 교수는 “현재 전 세계적으로 보존이 어려운 고문서 및 옛 문학을 디지털화해 보존하는 추세지만, 이를 실질적으로 활용하기 어렵다는 한계점이 있어, 이러한 상황을 해결하고 한국학 연구 토대를 마련하고자 문 프로젝트를 시작하게 됐다”라며 “향후 애저 머신러닝과 인공지능 기술을 접목해 한국학과 한국문학에 특화된 검색엔진으로 발전시키는 동시에 한국 문학의 아름다움을 새롭게 느낄 수 있도록 하는 것이 목표”라고 말했다.

한국마이크로소프트 필란트로피즈 총괄 박선정 변호사는 “클라우드 컴퓨팅은 산업 전반에 걸쳐 핵심 자원으로 부상하여 경제적으로 큰 영향을 미치고 있지만, 아직 많은 연구자 및 비영리 단체에까지 이러한 기술의 혜택이 닿지 못하고 있다”라며 “마이크로소프트는 기술의 발전이 경제적인 측면 외에도 사회, 문화적인 측면에도 기여해야 한다는 철학을 기반으로 이번 프로젝트를 지원하게 됐다”라고 말했다.

의견 0 신규등록      목록