버럭하는 '박명수 퀴즈쇼'에 박명수도 화들짝 놀란 사연

조회수 2020. 9. 23. 20:27 수정
번역beta Translated by kaka i
번역중 Now in translation
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 다양한 분야의 재밌고 유익한 콘텐츠를 카카오 플랫폼 곳곳에서 발견하고, 공감하고, 공유해보세요.

KT 인공지능(AI) 스피커 '기가지니' 퀴즈쇼 '박명수를 이겨라'
개인화 음성합성 기술로 박명수 구현
박명수 "내 목소리 비슷해 놀랐다"
엄마 목소리로 동화책 읽어주기도 가능

“문제 가즈~아. 이번 문제는 넌센스 퀴즈입니다. 매일 떼돈 버는 사람은?”

1)우리 아빠 2)펀드매니저 3)목욕탕주인

정답은 3번이라고 말하자 “정답~. 대단하십니다. 그럼 다음문제”라고 박명수가 특유의 목소리로 소리를 지른다. 

출처: 사진 KT 제공
박명수를 이겨라 결과

요즘 KT 인공지능(AI) 스피커 ‘기가지니’를 이용해 퀴즈쇼 ‘박명수를 이겨라’를 즐기는 사람이 부쩍 늘었다. KT측은 퀴즈쇼가 시작 한달만에 기가지니에서 가장 인기 있는 서비스로 자리를 잡았다고 밝혔다. 매일 박명수가 새로운 문제 5개를 내고 이용자가 답을 맞춘다. 아니 그렇다고 생각했다.


하지만 목소리의 주인공은 박명수인 동시에 박명수가 아니다. 문제를 맞추거나 틀릴 때 박명수 특유의 감탄사나 비아냥이 나온다. 버럭 하며 호통을 치기도 한다. 그래서 사람들은 박명수가 문제 대본을 모두 녹음했을 거라고 생각한다. 하지만 실제 박명수 목소리는 감탄사 “어우야” 등 일부다.

출처: 사진 jobsN
노희철 KT 과장

대부분의 박명수 목소리는 인공지능(AI)과 글을 음성으로 바꾸는 기술(TTS·Text to Speech)이 만든 진짜 같은 가짜다. 그러나 실제 박명수가 듣고 “내 목소리 같다”고 놀랐다는 진짜도 놀란 가짜다. 박명수를 이겨라를 기획한 KT AI 사업단 노희철 과장을 만나 박명수를 이겨라 개발 과정을 들었다.


아파트 공지 같은 어색한 음성합성 No


박명수를 이겨라에 사용한 기술 명칭은 PTTS(Personalized Text To Speech). ‘텍스트 음성 전환 기술’(Text To Speech)에 AI를 추가한 것이다. 특정인의 음색이나 억양과 같은 발음 습관을 분석해 최대한 자연스럽게 표현한다.


TTS 방식은 아파트 공지 음성과 같이 억양이 없는 단조로운 말이 이어진다. 공상과학영화처럼 사이보그가 감정없는 말을 하는 것이다. 지루하고 듣기에 따라 불쾌할 수도 있다. 

출처: KT 제공
KT AI 스피커 기가지니

PTTS는 개인화에 초점을 맞췄다. 말하는 사람의 발음습관을 분석하는 데 주목했다. 이세돌 9단을 이긴 알파고처럼 딥러닝(Deep Learning) 기술을 이용해 더 적은 문장으로 최대한 자연스러운 말을 구현할 수 있다.


“훨씬 짧은 녹음으로 방대하고 자연스러운 음성을 합성할 수 있다는 게 가장 큰 장점이에요. 여기에 비언어적 요소도 적용하면 대본을 읽은 사람도 자기 목소리와 구분하기 어려운 기계음을 만들 수 있습니다.”

출처: 사진 KT 제공
박명수를 이겨라 첫 화면

PTTS, 활용도 무궁무진


PTTS는 많은 분야에 응용할 수 있다. 일반인의 목소리를 녹음하면 엄마나 아빠의 목소리로 동화책 읽어주기 서비스를 만들어낼 수 있다. “생전에 녹화한 음성이 있으면, 고인의 목소리를 재현하는 것도 가능합니다.”


아직은 목소리를 구현하려면 제법 많은 데이터가 필요하다고 한다. 하지만 기술이 발전하면 필요한 음성 데이터양이 줄어들 것으로 예상하고 있다. “미션임파서블 3에서 에단 헌트(톰 크루즈)는 몇 가지 간단한 문장만으로 오웬 데이비언(필립 세이모어 호프만)의 목소리를 합성해 냅니다. 우리도 그렇게 하는 것이 목표입니다.”

출처: 사진 jobsN
박명수를 이겨라를 하고 있는 노희철 과장

KT는 박명수를 이겨라를 시작하면서 보도자료를 통해 합성한 소리라는 점을 밝혔지만, 퀴즈쇼에서는 이 사실을 알리지 않았다. 이용자들도 박명수가 녹음했다고 생각하며 퀴즈를 푼다. 처음에는 퀴즈이기 때문에 평소 박명수보다 5% 느린 목소리로 내보냈다. 목소리 전달이 안될까 염려했기 때문이다. “이용자들이 너무 느려서 박명수씨 목소리와 다르다고 항의했어요. 원래 속도로 돌려야 했죠. 이상적이라고 생각했던 것과 실제 목소리의 차이를 느낄 수 있었습니다.”


음성 합성은 AI 스피커 확산으로 각광을 받고 있다. 사람이 녹음한 것처럼 음성을 합성하면 응용할 수 있는 분야는 상상 이상으로 넓어질 수 있다. “기술 발전은 언제나 우리가 상상하는 것보다 빨랐어요. 아이폰이 처음 등장했을 때 아무도 지금 모습을 상상하지 못했던 것처럼 말이죠. 음성합성도 그런 분야라고 생각합니다. 그 가치는 ‘무엇을 상상하든 그 이상’입니다.”


글 jobsN 최광

jobarajob@naver.com

잡스엔

이 콘텐츠에 대해 어떻게 생각하시나요?