닫기 4차산업혁명시대
인간의 자리를 묻다
닫기

[김원배 칼럼]ICT 기업들의 번역 서비스의 현재, 그리고 미래

2017.03.28 FacebookTwitterNaver

헤밍웨이의 소설 <킬리만자로의 눈> 한 구절을 통해 번역의 진화를 확인할 수 있다. 원문은 No one has explained what the leopard was seeking at that altitude(표범이 그 고도에서 찾고 있던 것을 아무도 설명하지 못했다). 종전 구문 기반 기계번역은 ‘아무도 표범이 그 고도에서 보고 있었던 것을 입증하는데 실패하지 않았다’라는 번역 결과를 내놓았다. 신경망 기계번역 결과는 ‘표범이 그 고도에서 찾고 있던 것을 아무도 설명해 내지 못했다’는 번역 결과를 보여줬다. 구문 기반 기계번역과 신경망 기계번역(Neural Machine Translation)의 차이가 확연하다.

구글 & MS, 신경망 기반 기계번역 본격화

기존 구문 기반 기계번역(PBMT)이 문장을 단어와 구 단위로 쪼개서 하나하나 개별적으로 번역한 것과는 달리, 신경망 기계번역은 전체 문장을 하나의 번역 단위로 간주해 통째로 번역한다. 신경망 기반 기계번역(Neural Machine Translation)은 인공지능 구현의 핵심 기술인 머신러닝(기계 학습)과 딥러닝(인공 신경망)을 활용해 특정 언어를 번역할 수 있는 모델(인공지능)을 만든 이후, 모델을 활용한 번역 서비스를 제공하는 기술이다. 구글은 지난해 11월부터 신경망 기술을 적용한 완전히 새로운 수준의 서비스를 제공하고 있다. 구글 NMT 기술을 한국어를 포함한 8개 국어 총 16개 언어 번역 조합에 적용했다. 한국어 등8개 언어에 적용한 결과, 번역 품질이 개선됐다. NMT을 도입한 지 두 달 만에 한국어-영어 번역 이용량이50%나 증가했다.

구글은 NMT 번역 품질이 6점 만점을 기준으로 평균 5점 수준이라고 평가했다. 인간번역도 점수로 환산하면 5점 중반 정도라고 소개했다. 구글의 신경망 기계번역 서비스는 구글 번역 홈페이지와 구글 번역 앱을 통해 이용할 수 있다. 크롬 웹 브라우저에 포함된 구글 번역 기능에는 아직 신경망 번역이 적용되지 않은 상태다. 크롬 웹 브라우저에서 신경망 기계번역 기능을 이용하려면 크롬 웹 스토어에서 구글 번역 앱을 내려받아 설치해야 한다. 신경망 기계번역 서비스는 영어, 프랑스어, 독일어, 포르투갈어, 중국어, 일본어, 한국어, 터키어에 적용된 상태다. 하지만, 사람이 번역하면 절대로 없을 단어 누락, 고유명사와 희귀 용어 오역 등 오류가 발생한다.
구글과 세계 번역 서비스 시장을 양분 중인 MS의 빙(BING) 번역 역시 신경망 기계번역이 도입된 상태다. MS는 검색 사이트 빙과 윈도 운영체제에 자체 개발한 번역 서비스를 탑재했고 최근에는 아이폰과 안드로이드 스마트폰에서도 언어 번역을 제공하는 모바일 애플리케이션도 출시했다. MS의 번역 서비스에는 구글과 마찬가지로 첨단 인공지능 기술이 탑재돼 번역 오류를 낮추고 정확한 의미를 전달하는 역할을 수행한다. 특히 MS는 서로 다른 언어를 말하는 사람들 간 대화를 실시간으로 통역하는 기술에 큰 관심을 보이고 있다. 인터넷 전화 서비스 스카이프(Skype)를 보유하고 있는 MS는 2014년 스카이프에서 사람들의 말을 상대방의 언어로 바로 변환해 전달하는 통역 서비스를 선보였다. 당시 등장한 서비스는 사람마다 각기 다른 발음을 정확히 인식하기 어려워 원활한 대화를 지원할 수 없었다.

하지만 MS는 음성인식 기술의 주도권을 확대하기 위해 윈도 운영체제는 물론 스마트 스피커나 챗봇(Chatbot) 등에 자사의 음성인식 비서 소프트웨어 코타나(Cotana)의 탑재를 추진하고 있다.

구글-MS, 번역 우위는?

MS가 서비스를 소개하는 문구(Microsoft Translator introduces the world’s first personal universal translator)를 구글과 MS로 번역했다. 구글은 ‘Microsoft Translator, 세계 최초의 개인용 범용 번역기 소개’라며 ‘Microsoft Translator’를 고유명사로 표현했다. 데이터 축적을 통해 MS서비스라는 것을 학습한 결과로 추정된다. MS는 ‘세계 첫 번째 개인 범용 번역기를 소개하는 마이크로소프트 번역기’라는 문장을 내놨다. 두 번째 문장(The personal universal translator has long been a dream of science fiction but today that dream becomes a reality)은 구글이 자연스러운 결과를 내놨다. ‘개인용 범용 번역기는 오랫동안 공상 과학의 꿈이었지만 꿈은 현실이 되었습니다’라는 완벽에 가까운 문장이다. MS는 ‘개인 범용 번역기 과학 소설의 꿈 오래되었습니다. 하지만 오늘 그 꿈이 현실이 된다’라며 의미 전달은 되지만 단어 연결이 매끄럽지 못한 모습을 보였다. 오바마 전 미국 대통령의 고별 연설문(It’s the conviction that we are all created equal, endowed by our Creator with certain unalienable rights, among them life, liberty, and the pursuit of happiness)을 번역했다. 구글 번역에선 ‘우리 모두가 평등하게 창조됐으며, 창조주에 의해 어떤 양도할 수 없는 권리, 삶, 자유 및 행복 추구를 부여받았다는 확신이 있습니다’로 번역했다. 전문가가 번역한 문장과 유사한 형태를 보여줬다. MS의 빙은 ‘그것은 신념을 우리 모두 동등하게 만들어, 우리의 창조주에 의해 특정 unalienable 권리와, 그 중 부여 받은 생명, 자유, 그리고 행복의 추구’로 문장을 끝맺지 못했다. 뿐만 아니라 ‘양도할 수 없는’이란 뜻의 ‘unalienable’은 번역하지 못해 영문 그대로 표시했다.
물론, 특정 문구 번역으로 구글과 MS 간 우위를 판가름할 순 없다. 번역의 정확도, 의미전달, 자연스러움 등 기준에서 확연한 차이는 없다고 해도 과언이 아니다. 문장을 구성하는 단어를 연결하는 과정에서 뉘앙스 차이 정도다. 중요한 건 신경망은 입력된 정보를 기반으로 스스로 학습할 수 있기 때문에 사용 횟수가 늘어날수록 번역 품질이 개선된다는 점이다.

한편, 페이스북 역시 지난 2013년 음성 번역 소프트웨어 업체 모바일 테크놀로지스를 인수했다. 페이스북은 MS 빙의 도움을 받아 콘텐츠와 댓글에 대한 번역 기능을 제공했지만, 모바일 테크놀로지스 인수로 통제 가능한 자체 번역 기능을 제공할 수 있게 됐다. 앞서 지난해 1월 트위터는 MS 빙을 활용해 번역기능을 도입했다. 이전에도 수많은 번역 서비스가 존재했지만 최근 기술은 정확도를 높였다는 점에서 언어장벽을 무너뜨리고 있다고 평가된다.

인공지능 기술의 발전으로 사용 영역과 번역 품질이 이전과 비교할 수 없을 만큼 향상되고 있다. 물론 사람이 직접 번역한 것에 비하면 아쉬운 구석이 많긴 하지만, 각 언어에 대한 빅데이터가 축적되고 인공지능 기술이 발전을 거듭하면 번역 수준은 갈수록 높아질 것으로 기대된다.

출처: SK텔레콤 월간 디지털 매거진 CONNECT+ 3월호에서

FacebookTwitterNaver