권중혁 2014 "유라시아어의 기원과 한국어 #산스크리트어"
(권중혁 2014)
권중혁 산스크리트어 #대안연
- 산스크리트어 직독직해 프로그램을 제작하기 위해 대안연 ] 세미나를 중단한 권중혁 선생님의 근황 (대안연구공동체(CAS)) | 작성자 느리게살기
- https://cafe.naver.com/paideia21/14775
- 2014 년 여름, 대안연구공동체에서는 이색 특강이 열렸습니다. 한국어만 할 수 있다면 이르면 한나절, 길어도 한 달 만에 산스크리트어를 익힐 수 있다는 분의 특강이었습니다. 강의를 연 이는 서울대 제어계측학과를 졸업한 뒤 국방과학연구원과 삼성전자연구원에서 연구원으로 일했던 권중혁 선생님이었습니다. 뒤늦게 불교에 심취하며 경전을 읽기위해 산스크리트어를 공부했고 공부하다 보니, 한국어와 산스크리트어는 뿌리가 같고, 훈민정음은 이에 대한 연구를 바탕으로 창제한 문자라는 것을 발견했다는 겁니다.
- 산스크리트어가 어떤 언어인가요? 인류가 만든 언어 중에서 가장 어렵고 정교한 언어로 정평 난 언어입니다. 힌두교와 불교 경전 등을 기록한 산스크리트어는 대대로 이 언어를 전승해온 인도의 브라만들도 머리가 희끗희끗해져야 비로소 능숙해진다는 말이 있을 정도입니다. 불교를 공부하는 사람들이 배우고자 하나 너무 어렵고 외울 것이 많아 대부분 중도 포기한다는 언어가 바로 산스크리트어입니다. 이 때문에 국내에서 산스크리트어를 제대로 하는 학자들은 많지 않습니다. 그 몇몇도 인도 등지에 몇 년씩 유학하며 어렵게 익힌 사람들이 대부분입니다.
- 산스크리트어가 어렵다 보니 부작용도 없지 않았습니다. 대표적인 것이 한역(漢譯) 불교 경전의 난해함, 또는 오역을 감내해야 한다는 겁니다. 이나 을 포함한 대부분의 불교 경전은 산스크리트어로 고정된 뒤 한문으로 옮겨져 우리나라로 들어왔습니다. 그러나 산스크리트어의 난해함과 한문과의 서로 다른 언어 구조 때문에 간명하고 쉬울 수도 있는 경전이 추상적이고 어려워졌다는 것이 많은 학자들의 주장입니다. 또한 일부 오해의 소지가 있는 번역어를 쓰거나 아예 잘못 번역돼 본래 뜻이 왜곡돼 버리기도 한 것으로 알려져 있습니다.
- 권중혁 선생님이 산스크리트어를, 독학으로 공부하게 된 계기도 이 때문이었습니다. 한역 불경을 읽다 추상적이고 난해한 개념들을 산스크리트어로 읽으면 어떨까 해서 이를 공부했고, 그러다 보니 한국어와의 강한 친연성을 보게 되었다는 겁니다. 연구원에서 일하며 언어학을 공부한 적이 없던 그는 이과 출신답게 산스크리트어와 한국어의 구조와 음운은 물론, 컴퓨터로 주파수까지 분석하며 파고들다 어렴풋하던 자신의 가설에 확신을 가지게 됩니다. 시베리아 볼가강 유역을 중심으로 동서로 퍼져나간 고대 인골의 유전자를 분석한 논문을 비롯해 고고학 연구의 최신 성과를 두루 섭렵하며 그의 확신은 더욱 강해졌습니다.
- 그는 자신의 발견에 힘입어 어렵지 않게 스스로 산스크리트어를 익힙니다. 그가 언어를 익힌 것 못지않게 중요한 건 그가 발견한 언어의 본질과 구조에 대한 새로운 이해입니다. 이를 정리하기 위해 몇 년간 산스크리트어와 언어학 연구에 매달린 그는 거칠게나마 어원, 즉 말의 뿌리를 바탕으로 한 새로운 언어학 체계를 만들어 냅니다. 한국어를 하는 사람이면 다른 언어권의 사람은 상상할 수도 없을 만큼 빠른 속도로 산스크리트어를 익힐 수 있는 방법도 나름대로 체계화했습니다. 이 과정에서 그는 산스크리트어를 배우면 라틴어를 비롯한 여타 유라시아어의 학습에도 큰 도움을 얻을 수 있다는 사실도 확인했습니다. 그의 지인인 어느 대학의 프랑스어 교수는 이 방법으로 단 며칠 만에 산스크리트어를 익힌 것에 이어 다시 일주일 만에 라틴어를 깨쳤다고 합니다. 그리고 여기서 다시 한 달 만에 고대 희랍어 고전을 읽었다고 하는군요. 한국인이 단 한 차례, 한 나절 강의를 들은 뒤 며칠 공부하면 산스크리트어 경전을 해독할 수 있는 특강을 대안연에서 연 것도 이 때문이었습니다. 그가 특강을 연 목적은 자신의 발견을 나누는 것에 더해, 거칠게 수립한 자신의 새 언어학을 보다 정교하게 다듬어갈 (가능하면 젊은) 동료를 찾는 것이기도 했습니다.
- 그러나 이 계획은 생각대로 되지 않았습니다. 한 나절 특강을 들은 뒤 혼자 며칠 더 공부해 산스크리트어를 깨치는 일이 대부분의 참여자들에게 불가능했던 탓입니다. 그나마 언어 감각이 빼어나고 공부가 몸에 익은 몇몇 분은 강의 현장에서 산스크리트어를 해독하는 모습을 보이기도 했습니다. 특히 일본어와 중국어, 프랑스어, 베트남어를 스스로 깨친 분으로, 당시 대안연에서 속성 일본어를 가르치던 장의균 선생님은 그 중에서도 발군이었지요. 장의균 선생님은 특강 한번 들은 것을 바탕으로 혼자 조금 더 공부해 산스크리트를 익힌 뒤 산스크리트어 원전에서 직역한 을 어느 불교 신문에 연재하기도 했습니다.
- 그러나 대다수 사람들은 한나절 강의로 산스크리트어를 해독하는 것은 어렵다는 것에 의견을 모았습니다. 특강에서 한 걸음 나아가 산스크리트어로 을 읽는 세미나(강의)를 몇 개월 지속했던 것은 이 때문입니다. 이 세미나도 대다수가 중도포기하고 마지막까지 산스크리트어를 깨치는데 성공한 이는 불교학자나 언어학자 등 첫 특강 참석자의 10% 안팎에 지나지 않았습니다. 그러던 어느 날, 그는 갑자기 이 세미나를 중단합니다. 세미나에서 몇 명씩 모아 가르치는 방법으로는 승부가 나지 않는 만큼 아예 컴퓨터 프로그램을 만들어 원하는 사람이면 누구나 홀로 공부할 수 있게 하겠다는 것이었습니다.
- 그로부터 7 년 여, 오늘 낮 권중혁 선생님이 참 오랜만에 문자를 보냈습니다. 강의를 중단하고 개발하던 것을 일단락해 임시로 인터넷에 연결했으니 한번 써 보라는 것이었습니다. 확인해 보니 라는 예상 외의 프로그램이었습니다. 2500 년 전 산스크리트어 문법학자인 파니니의 문법과 이를 기초로 동국정운을 완성하고 한글을 창제한 세종 대왕의 언어학을 바탕으로 만든 한국어 분석기였습니다. 그러나 언어 문외한인 저는 도대체 이것을 무엇에 쓰는지 알 수 없었습니다. 그와 길게 통화하며 추가 설명을 들어야 했습니다.
- 알고보니 그가 산스크리트어와 한글을 직독직해하는 프로그램 대신 한국어 분석기를 만든 것은 이유가 있었습니다. 한국어야말로 고대 시베리아, 볼가강 유역에서 분기된 원인도유럽어(Proto Indo Euroup Language)의 원형이 가장 잘 보존된 언어라는 겁니다. 한국어를 하는 사람이면 고대어인 산스크리트어를 쉽게 할 수 있는 것도, 산스크리트어 또한 원인도유럽어의 원형이 비교적 잘 보존돼 있기 때문입니다. 원형이 잘 보존된 순서대로 언어를 대략 나열하면 (14 세기) 한국어-산스크리트어-라틴어-희랍어-그리고 인도이란어파(힌디어, 페르시아어, 우르두어 등), 로망어파(이탈리아어, 프랑스어, 스페인어 등), 게르만어파(독일어, 네덜란드어, 스웨덴어, 노르웨이어, 영어 등), 슬라브어파(러시아어, 폴란드어, 불가리아어 등). 켈트어파 등의 순이라는 것이지요. 산스크리트어를 익힌 프랑스어 교수가 다시 일주일 만에 라틴어를 익힐 수 있었던 것도 산스크리트어와 라틴어의 친연성 때문이라고 했습니다.
- 그가 산스크리트어-한국어 직독직해를 위한 프로그램 대신 한국어 형태소/구문 분석기를 만든 것도 한국어에 원인도유럽어의 근원이 담겨있기 때문이었습니다. 한국어 분석기를 제작한 것은 일종의 기초 작업이었습니다. 일단 이것이 바탕이 되어야 산스크리트어와 라틴어, 고대 희랍어, 기타 언어 학습으로 나아갈 수 있다는 것입니다. 그가 분석기를 만든 이유는 이 밖에도 많았습니다. 언어를 정확하게 분석하면 외국어 번역기를 정확하게 만드는데 큰 도움을 받을 수 있는 것도 그 중 하나입니다. 현재 구글의 번역기는 딥러닝에 의존하고 있습니다. 수천만, 수억개의 문장을 컴퓨터에 입력해 학습하게 해서 통계적으로 비슷한 번역을 찾아내는 방식입니다. 그러나 이 방법은 비효율적인데다 한계 또한 많습니다. 한국어와 다른 언어의 서로 다른 구조, 그리고 다른 언어보다 훨씬 복잡 미묘하고 표현 범위가 넓은 한국어 어휘와 구조 때문에 더욱 그렇습니다. 산스크리트어나 기타 유라시어는 한국어의 부분집합이라고 합니다.부분집합으로 전체집합을 표현하는 것이 어려울 수 밖에 없다는 겁니다. 외국어를 한국어로 옮기는 번역기는 상대적으로 발전이 빠른데, 한국어를 외국어로 번역하는 번역기의 성능은 좀처럼 좋아지지 않는 것도 이 때문입니다.
- 이런 상황에서 복잡한 한국어의 형태소와 구문을 분석해 이를 딥러닝에 활용하면 마구잡이로 자료를 던져주고 언어 학습을 시키는 것보다 훨씬 더 효율적이고 정확한 번역기가 가능하다는 것이지요. 또한 이 분석기는 외국인이 한국어를 배우는 것에도 여러 가지로 도움이 될 뿐 아니라 여러 유라시아 언어 분석기의 출발점이 될 수도 있습니다. 역시 한국어가 고대 시베리아에서 분기해간 수많은 언어들의 원형을 가장 잘 담고 있기 때문입니다. 저처럼 번역기에 관심이 별로 없는 사람에게도 이 분석기는 쓸모가 있었습니다. 문장이 깔끔하면 정연한 구문 분석이 나오는 것에 반해, 문장이 어지러우니 구문 분석 또한 어지러워지더군요. 분석기를 활용하니 단번에 비문을 찾아낼 수 있었습니다. 글을 탈고할 때 써 봐야겠다고 마음 먹었지요.
- 권 선생님에 따르면 이 분석기는 초보적인 출발점일 뿐입니다. 아이디어는 차고 넘치는데 혼자서 할 수 있는 일에 한계가 있으니 마음이 급하다고 합니다. 아닌게 아니라 그는 언어학 공부에서 암시받은 것으로 패터다임의 일대 전환을 꿈꾸고 있었습니다. 아직 불완전한 한국어 분석기를 공개하는 것도 일단 가능성을 보여준 뒤 아이디어 상태로만 존재하는 수많은 것들을 더불어 현실화할 동료를 찿고 팀을 만들기 위한 것이라고 했습니다.
- 하지만 제대로 이해도 못한 채 급하게 써대는 이 어지러운 글로, 그가 만든 분석기며 그가 지닌 원대한 계획의 가치를 알아볼 분이 과연 얼마나 될지요? 그래도 눈밝은 이는 한국어 분석기만 시험해 보아도 보이는 것이 있겠지요. 통화한 내용을 잊어버리기 전에 부실함을 무릅쓰고 후다닥 글을 올리는 이유입니다.
- 한국어 분석기를 시험하시려면www.panini-sejong.com으로 들어 가셔서 인터넷 기사 등의 문장을 긁어 창에 넣으시고 확인을 눌러 분석을 시키면 됩니다. 산스크리트어 직독 직해와 한국어 분석기, 이를 활용한 외국어 번역기 딥러닝, 그리고 그가 꿈꾸는 여러 일들에 관심을 가진 분들은joonghyuckk@naver.com 로 권중혁 선생님께 연락하시길~~
- [출처]산스크리트어 직독직해 프로그램을 제작하기 위해 대안연 산스크리트어 세미나를 중단한 권중혁 선생님의 근황 (대안연구공동체(CAS))| 작성자느리게살기
Related-Notes
References
권중혁. 2014. 유라시아어의 기원과 한국어 #산스크리트어. https://blog.naver.com/joonghyuckk.