지난주 목요일, 추위가 맹위를 떨치던 저녁에 바벨탑 통번역사 포럼이 열렸습니다.
‘인공지능이 과연 통번역사를 대체할 수 있을까’를 주제로
딥러닝과 기계학습을 연구하고 계시는 서울대학교 허민오 연구원의 강연을 듣고,
통번역사 여러분과 다채로운 이야기를 나누었습니다.
연사 허민오 연구원은…
현재 서울대학교 컴퓨터공학부 바이오지능연구실에서인공지능과 기계학습 연구원 입니다.
추운 겨울 밤, 뜨거운 열정으로 가득했던 통번역사 포럼 현장 한 번들어가 볼까요?
사람처럼 생각하고 사람처럼 행동하는 기계, 인공지능(AI)
인공지능은 최근 폭발적으로 늘어난 데이터 양으로 인해
인식(Perception)능력이크게 향상되어
인간이 보고, 듣고, 언어로 표현하는 소통능력을 거의 비슷한 수준으로 할 수 있게 되었습니다.
이미지를 언어로 표현한다든가, 말하는 사람의 입술을 읽고 받아쓰기를하는 등,
빅데이터와 기술의 발전으로 인공지능은 놀라울 만큼 인식능력이 좋아졌습니다.
그러나 인공지능은 아직까지 다양한 요소를 고려하고 결정해야 하는
복잡한 문제를 해결할 만한 수준은 도달하지 못했다고합니다.
기계와 마찬가지로 인공지능도 입력된 정보를 연산하여
결과를 출력하는 함수를 기반으로 작동하기때문입니다.
인공지능의 언어 데이터 학습
그렇다면, 인공지능은 번역을 위한 데이터를 어떻게, 얼마나 학습하고 있을까요?
현재로서 약 수천만 개의 문장이 인공지능 번역에 사용되고 있다고 합니다.
또한학습에 필요한 언어 데이터는 구글, 아마존 등을 비롯해
전세계에서 많은 사람들이 접속하는 검색엔진에쉴 새 없이 축적되고 있습니다.
다양한 언어 사용자가 접속하는 구글과 같은 검색엔진은
각각의 언어쌍 데이터를 축적하기에 매우 유리한 환경입니다.
즉, 구글의 인공지능은 더 많은 양의 언어 데이터를 학습하여,
‘정확도’가 보다 높은 번역을 할 수 있게 되는 겁니다.
우리 번역사에게 정확도가 번역의 중요한 기준이듯,
기계번역에서도 정확도는매우 중요한 이슈입니다.
과거에는 통계 기반의 번역기술로 정확도가 그다지 좋지 못했으나,
현재는 데이터 학습을 통한 인공신경망 기반 기계 번역(NMT, NeuralMachine Translation) 으로
인공지능이 언어를 문장 단위로 학습해 더 정교한 결과물을 내고 있습니다.
그러나 기계번역의 결과물은 어디까지나‘쓸 만한’ 번역이지
전후 문장 관계가 잘 어우러진 ‘고품질’ 번역을 대체하기란 쉽지 않다고 합니다.
단락 단위, 문서 단위의 글이 함께 고려된 번역에는
훨씬 더 많은 분량의 데이터를 필요로 하는데,
이러한 데이터는 여전히 절대적으로 부족하기 때문입니다.
‘통번역사는 되면 안돼. 대신에…’
마이크로소프트(Microsoft)의 기계번역 팀 프로그램 책임자 크리스웬트(Chris Wendt)는
자식이 ‘저는 커서 번역사가될 거예요.’ 라고 말하면
‘안돼. 대신, 언어 문화 컨설턴트가 되는 건 어떠니.’ 라고 말하겠다고 했습니다.
심지어는 그 직업마저 앞으로 점차 설 자리를 잃어 갈 것이라고 예상했습니다.
(관련 읽을 거리: The FutureDoes Not Need Translators.)
강연을 통해, 통번역사라는 직업이 받게 될 위협이
곧 현실이 될 것이라는두려움을 느꼈지만,
동시에 통번역사가 한 분야에서 특화성을 키우고,
컨텐츠 크리에이터로 거듭날 수 있다면
기술의 진보와 함께 발전해 나갈 수 있지 않을까 하는 희망 찬 미래도 상상해봤습니다.