닫기
닫기

구글 I/O 2018로 보는 구글 AI의 진화 1편-사람처럼 말하는 인공지능, 듀플렉스

2018.06.21 FacebookTwitterNaver

▲ 모두를 위한 인공지능을 선보인 ‘구글 I/O 2018’에서는 인공지능의 방향을 제시했습니다

지난 5월 미국 캘리포니아에선 구글의 연례행사 중 가장 큰 개발자 컨퍼런스인 ‘*구글 I/O 2018’이 열렸습니다. 작년 구글 I/O 2017의 모토가 인공지능을 가장 우선시하는 ‘인공지능 퍼스트 (AI First)’ 였다면 이번 구글 I/O 2018의 모토는 인공지능이 우리의 실생활에 좀 더 깊숙하게 침투시켜, 인공지능의 범용성과 접근성을 높이는 ‘모두를 위한 인공지능(AI For Everyone)’이었습니다.

그리고 실제 사람 목소리를 가지고 지속적인 대화를 유지해 가는 인공지능 서비스, ‘듀플렉스 (Duplex)’를 선보이며 인공지능이 나가야 할 방향을 제시해줬다는 평가를 받고 있습니다. 물론 아직 테스트 버전입니다만 안드로이드에도 새로운 인공지능 서비스가 탑재되고 있습니다. 구글이 추진 중인 자율주행 자동차 ‘웨이모’에도 새로운 인공지능 기술들이 적용돼 이번 콘퍼런스에 함께 등장했는데요. 과연 구글 인공지능의 진화, 어디까지 갔을까요?
* 구글이 미국 캘리포니아주 샌프란시스코에서 한 해에 한 번 개최하는 개발자 지향 콘퍼런스

진짜 사람 같은 구글 어시스턴트, 듀플렉스를 탑재하다

▲ 구글 듀플렉스의 시연은 인공지능의 방향성을 보여줬다고 평가받고 있습니다

이번 구글 I/O에서의 최고의 화제는 단연 구글 듀플렉스의 시연이었습니다. 화자가 구글 어시스턴트를 통해 ‘화요일 10시에서 12시 사이에 머리를 깎기 위한 약속을 잡아달라’는 요청을 합니다. 그러자 구글 어시스턴트가 해당 날짜와 시간에 약속을 잡고 곧 업데이트하겠다고 답합니다.

▲ 듀플렉스 시연은 인공지능과의 대화라는 생각이 들지 않는다는 점에서 놀라움 그 자체였습니다

구글의 듀플렉스가 탑재된 어시스턴트는 화자를 대신해서 실제 헤어샵에 전화를 걸어 마치 사람이 직접 예약을 하는 것처럼 대화를 이어간 후 화제가 된 ‘음-흠 (Mm-hmm)’이라는 의성어와 함께 예약을 확정하고 대화를 마무리합니다. 놀라운 점은 이 대화가 시연을 위해 만들어진 상황이 아니라는 것입니다. 위의 시연 동영상을 보신 분들이라면 미래에는 인공지능과 사람이 통화를 하는 것은 물론, 상대방이 인공지능인지 구분하지 못할 수도 있겠다는 생각을 하셨을 거라 생각됩니다.

▲ 구글 듀플렉스와 구글 어시스턴트 및 사용자간 워크 플로우(Work Flow)를 도식화한 그림입니다

이처럼 듀플렉스가 탑재된 구글 어시스턴트가 대화의 맥락과 화자의 뉘앙스까지 이해를 하며 실제 사람처럼 대화하는 장면을 보면 구글이 어떻게 이러한 인공지능을 구현할 수 있었는지 궁금해지는데요.

구글은 지속적인 대화(Continued Conversation)를 실제 사람과 유사한 보이스(New Voice)와 복합적인 행위(Multiple Actions)로 구현하기 위해 여러 가지 기술을 적용했습니다. 새로운 자연어 처리 기술(Natural Language Understanding), 신경망 기반의 딥러닝(Deep Learning), 문자를 음성화해주는 TTS(Text-to-Speech), 그리고 가장 중요한 RNN(Recurrent Neural Network) 기술을 적용해 자연스러운 대화를 만들 수 있게 된 것입니다.

‘순환 신경망’이라고도 불리는 RNN은 구글 어시스턴트가 실제 상황에서 부딪힐 수 있는 여러 가지 난점을 극복하기 위해 구글의 ‘텐서플로우 익스텐티드(TFX)’를 통해 설계되었으며, 이러한 기술을 통해 단순히 발화된 단어뿐만 아니라 각 단어가 활용되는 전체적인 대화의 맥락까지도 이해하고 처리하게끔 설계되었습니다.

또한 이러한 대화의 맥락에 맞는 고정밀 데이터를 확보하기 위해 단순 단어의 의미에 의한 훈련이 아닌 익명의 전화 통화 데이터 뭉치를 통해 순환 신경망을 학습시켜 지금과 같은 결과를 얻었다고 발표했습니다.

▲ 구글 듀플렉스는 구글의 자동 음성 인식(ASR, Automatic Speech Recognition) 기술의 출력물을 활용한 신경망에 기반하고 있고 구글은 이를 RNN이라고 부릅니다

아직 구글 듀플렉스는 개발 중인 테스트 버전입니다. 그리고 현재 수준을 보면 일반적인 대화를 모두 지금처럼 시연할 수 있진 못합니다. 단지 특정한 유형의 약속을 예약하는 것과 같은 한정된 작업만 수행 가능하죠.

하지만 분명한 것은 구글의 이번 시연이 앞으로 일반 대화를 할 수 있는 수준의 인공지능이 등장할 것이라는 기대와 우려를 한꺼번에 주고 있다는 사실입니다. 인공지능이 앞으로 어디까지 발전할 수 있고 어떤 방향으로 나갈지에 대해 말이죠. 가까운 미래에는 “안녕하세요. 저는 인공지능 비서 00입니다.”라고 걸려오는 전화를 받게 되지 않을까요?

이번 구글 I/O 2018에선 인공지능과 관련해서 구글이 지금까지 진행해 온 매우 많은 것들을 공개했는데요. 앞선 내용에선 먼저 가장 큰 화제를 불러일으켰던 구글의 듀플렉스에 대해 정리해 보았습니다. 다음 2편에서는 실질적으로 우리가 가장 빨리 그리고 쉽게 구글의 인공지능을 접할 수 있는 스마트폰 운영 체제인 안드로이드 P에 적용된 인공지능 이야기와 구글이 우리의 실생활에 적용 중인 인공지능, 그리고 또 다른 이슈 중의 하나인 자율주행 자동차와 관련한 내용을 정리해보도록 하겠습니다.

글. 커넥팅랩(최형욱)

FacebookTwitterNaver