통합 검색어 입력폼

'카카오미니'는 왜 말이 짧을까?

조회수 2018. 1. 19. 15:26 수정
번역beta Translated by kaka i
번역중 Now in translation
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 다양한 분야의 재밌고 유익한 콘텐츠를 카카오 플랫폼 곳곳에서 발견하고, 공감하고, 공유해보세요.

'춘추전국시대' 국내 AI 스피커 시장에서 잠재력을 인정 받고 있는 카카오미니
“헤이 카카오. 너 말이 좀 짧다?”


흔히들 음성인식 AI라고 하면 대번에 음성인식 ‘비서’를 떠올리죠. 애플의 시리가 그렇고 구글의 구글 어시스턴트가 그렇듯이 말이죠! 그런데 지난해 카카오의 인공지능 ‘카카오 I(아이)’가 적용된 AI 스피커 ‘카카오미니’로 AI 스피커 시장에 출사표를 던진 카카오는 좀 다른 전략을 꾀하고 있습니다.

출처: 블로터
(헤이 카카오!)

바로 ‘비서 느낌’이 안 나는 AI 스피커를 지향하는 차별화 전략을 짠 건데요, ‘친근한 카카오’의 느낌을 살리기 위해서입니다. 음성인식 성우도 20대 선호도가 높고, 비음이 있는 목소리로 정했죠.


카카오 UX(사용자경험)랩에서 AI 스피커의 상호작용을 담당하고 있는 김종학 카카오 UX랩 ATF장은 “우리는 (성우의 목소리가) ‘홍대 삘 난다’고 판단했다”라며 “일단 비서 같은 느낌이 아니고 싶었기 때문에 여성적인 이름도 배제했다”라고 말했습니다.

‘헤이 카카오’, ‘카카오야’ 등의 호칭은 카카오라는 이미지가 친숙하다고 판단해 정한 이름이랍니다. 부를 때 혼동되지 않아야 하는데, 뭐 나름 오류가 없다고 해요.


그리고 중요한 점. 일부러 ‘대답이 짧게’ 만들었다고 합니다. 비서처럼 정중한 말투를 쓰지 않기 위해 ‘습니다’체는 가급적 지양했고, ‘요’체로 말하도록 했죠. 만약 사용자가 요청한 사항을 못 알아들으면 카카오 미니는 “죄송해요”, “잘 못 들었어요”라는 말 대신 이렇게 말합니다.

“네?”

카카오는 메신저, 모빌리티, 모바일 뱅킹, 음악 스트리밍 등 다양한 서비스를 품고 있습니다. 이 때문에 국내 AI 스피커 시장에서 카카오가 가진 잠재력은 높게 평가됩니다.


그러나 아직까지 음성인식 AI의 수준은 걸음마 단계에 가깝습니다. 기대하기엔 무리가 있죠. 사람들이 원하는 영화 속 AI의 모습을 AI 스피커가 구현하려면 꽤 오랜 시간이 필요할 겁니다. 


오늘은 전망 높은 카카오가 앞으로 가져가려 하는 전략 정도만 훑어보기로 합시다!

출처: 출처 : 카카오

화면 없는 음성인식 인터페이스


AI 스피커는 화면이 없습니다. 스마트폰처럼 시각정보를 충분히 전달받을 수 있는 인터페이스를 사용하다 AI 스피커를 쓰면 때론 답답하고 불편하죠.


예를 들어볼까요?


스마트폰으로 알람을 지정하면 평일, 주말 반복 등 다양한 종류로 설정할 수 있고 앱에 들어가 자신이 어느 시간대에 알람을 설정했는지 돌아볼 수 있죠. 하지만 음성인식 인터페이스에선 언제 알람을 맞춰놨는지 기억하기 쉽지 않습니다. 그래서 카카오미니는 같은 시간대에는 하나의 반복알람만 할 수 있도록 설정했습니다.


“(알람은) 자기 전에 하고 금방 까먹을 것이다. ‘관리하지 않고 쓸 수 있게 해주자’ 이런 방식이다.”
출처: 블로터
(김종학 카카오 UX랩 ATF장)

카카오아이 앱에 별 기능이 없는 것에도 카카오의 의도가 담겨 있습니다. 타사 AI 스피커가 “검색 결과를 앱에서 확인하라”고 말한다면, 카카오미니는 오히려 “기기에 요청하라”고 지시하는 식입니다.


사용자가 스마트폰 앱을 보지 않고 사용하는 데에 익숙해지게끔 유도하기 위해서죠.


김종학 UX랩 ATF장은 “앱에 검색기능을 넣을 수도 있는데 우리는 앱을 보지 않고 사용할 수 있게 많이 유도했다”라며 “웬만하면 사용자가 뭘 하지 않도록, 음성발화를 유도하려고 뭘 많이 뺐다”라고 말했습니다.

데이터 수집, 괜찮을까?


카카오의 강점은 카카오톡입니다. 카카오미니는 ‘카톡 보내기’ 기능에 이어 올해 상반기 안에 ‘카톡 읽어주기’ 기능도 지원할 예정입니다. 이런 걱정이 들 수도 있습니다.


‘다른 사람이 카톡을 보내거나, 다른 사람이 내 카톡을 몰래 ‘들으면’ 어떡하지?’


당연한 질문입니다. 이에 카카오는 등록한 사람의 목소리를 알아듣고 그 사람의 요청만 수행하는 ‘화자인식’ 기능을 준비 중입니다. 

출처: 블로터

사용자가 AI 스피커 구매를 고려할 때 가장 걱정되는 부분은 또 있습니다. AI 스피커는 ‘이름’을 불러야 작동하는데 호출을 기다리는 동안 주변 소리를 듣고 있어야 호출에 반응할 수 있습니다.


이 때문에 해킹에 대한 우려가 있습니다. 또 사람들의 지시, 명령사항은 데이터로 수집됩니다.


만약 대응이 안 되거나 잘못 분류된 발화는 분석을 위해 따로 모아두는데요, 사용자가 가진 데이터가 어떻게 활용되고 가공되는지 정작 사용자 본인은 알기 어렵습니다.

출처: 블로터
이러한 사용자의 우려를 줄이기 위해 아마존 AI 스피커 ‘아마존 에코’는 사용자가 클라우드에 저장된 음성명령 녹음 데이터를 삭제할 수 있고, 사용자가 원하면 에코 기기의 마이크를 끌 수 있게 돼 있습니다.


카카오 관계자는 “호출되기 전 주변 소리를 들어도 저장되거나 서버로 전송되진 않는다”라며 “카카오는 음성정보와 개인정보를 같다고 본다. 개인을 식별할 수 있는 정보와 음성정보는 분리해 음성정보의 주체를 확인하기 어렵게 보관하고 있다”라고 말했습니다. 또 ‘카톡 보내기’ 기능으로 전송된 카카오톡 메시지는 카카오톡 정책과 동일하게 관리 및 처리되고 있다고 설명했습니다.


하지만 카카오톡처럼 매우 개인적인 메신저 서비스를 제공하고 있는 만큼 카카오는 더 강력한 보안 정책을 세우고 사용자에게 투명하게 공개할 필요가 있을 것으로 보입니다. 

카카오의 꿈, ‘커넥트 에브리씽’

카카오미니는 검색도 안 되고 사용자가 원하는 것을 알아서 척척 해내는 법도 없습니다. 아직 한 문장 안에 두 가지 이상 지시사항이 있을 시 이에 대응하는 것도 벅찬 수준이죠. 카카오가 가진 당장의 비전은 자사 서비스에 있습니다.


일단 멜론서비스와 연동되는 것만 해도 엄청난 장점이죠...!

출처: 블로터
카카오는 향후 카카오 택시 호출, 음식 주문, 장보기, 카카오페이 등 금융 서비스, IoT까지 카카오미니에서 이용할 수 있는 영역을 넓혀갈 계획입니다.

카카오가 가진 생활서비스의 범위를 고려하면 카카오미니는 ‘똑똑하진 않지만 착실한’ 음성인식 AI 스피커의 역할은 가능할 것으로 보입니다.


김종학 UX랩 ATF장은 “사용자가 요청하는 것에 대해서 (카카오미니가) 70-80% 답을 준다면 똑똑하다고 느낄 것 같은데 지금은 아직 말에 대해서 커버가 어려운 편입니다. 개선하려 하고 있다”라며 “서비스를 제공하는 도메인에 대해서는 다양한 발화가 들어와도 웬만큼 (처리)할 수 있다”라고 말했습니다.

이 콘텐츠에 대해 어떻게 생각하시나요?