본문 바로가기

댓글0
번역beta

Translated by kakao i

번역할 언어 선택

뷰 본문

BBC News | 코리아

아마존 AI 비서 '알렉사', 수화 인식한다

'미래의 가정용 기기는 청각장애인 또한 이용할 수 있도록 설계되어야 한다'

467 읽음
댓글0
번역beta

Translated by kakao i

번역할 언어 선택

만일 음성 인식이 컴퓨터 사용의 미래라면 보거나 듣지 못하는 사람은 어떻게 해야 할까?

소프트웨어 개발자 아비쉑 싱(Abhishek Singh)이 아마존 AI 비서 '알렉사'의 수화 인식을 가능하게 하는 시스템을 개발했다.

이 시스템은 웹캠을 통해 사용자의 몸짓을 식별하고 이를 텍스트와 음성으로 해석한다.

싱은 미래의 가정용 기기는 청각장애인 또한 이용할 수 있도록 설계되어야 한다고 말한다.

지난 몇 년 간 아마존, 구글, 애플이 운영하는 음성 비서 서비스의 인기는 계속해서 상승했다.

스마트 오디오 리포트(Smart Audio Report)에 따르면, 미국 내 스마트 스피커 도입량은 스마트폰과 태블릿의 도입량을 능가했다고 한다.

하지만 청각 장애인에게 이러한 음성에 의존하는 기기의 발전은 문제가 된다.

음성인식은 청각 장애인 사용자의 리듬을 인식하기가 어렵고, 음성 보조 장치와의 의사소통에도 명백한 어려움이 따른다.

싱의 시스템은 사용자가 미국식 수화(ASL)를 하면 알렉사가 이를 텍스트로 인식하고 음성과 함께 텍스트로도 답변하는 서비스를 제공한다.

그는 "음성에 의지하는 장치들이 집, 업무환경과 연결되는 중심이 되려면 듣지 못하거나 말하지 못하는 사람들도 사용할 수 있는 방법이 개발되어야 한다"며 "원활한 설계는 기본적으로 포괄적이어야 한다"고 강조했다.

싱은 구글의 AI 오픈 프로그램 텐서플로(TensorFlow)를 활용해 이러한 시스템을 만들었다. 텐서플로는 AI의 기계 학습 응용 프로그램을 코딩해 웹 브라우저에서 이가 실행되는 것을 돕는다.

사용자가 수화 언어를 사용하면 구글의 텍스트 음성 변환 소프트웨어가 수화 언어를 텍스트로 전환, 해당 단어를 음성으로 변환한다.

아마존 에코(Amazon Echo)가 이에 반응하고 알렉사의 음성 반응은 자동으로 컴퓨터에 의해 텍스트로 변환되어 사용자는 이를 읽을 수 있게 된다.

즉, 노트북을 사용자와 알렉사 사이의 통역사로 이용하는 것이다.

싱은 "아마존 쇼(Amazon Show)나 카메라 혹은 스크린을 기반으로 하는 음성 비서 서비스가 이런 기능을 구축하지 못할 이유가 없다"며 "이가 이 시스템이 갖는 궁극적인 사용 사례라고 생각한다"고 말했다.

수화 인식 AI 비서, 미래는?

수화 번역을 위해 인공지능과 영상인식 기능을 이용하려는 시도는 이번이 처음이 아니다.

마이크로소프트는 수화 번역을 실험하기 위해 동작 감지 키넥트(Kinect)카메라를 이용했지만, 키넥트가 2017년 중단되면서 이 프로젝트 또한 서서히 중단됐다.

엔비디아(Nvidia)또한 인공지능을 사용해 번역 소프트웨어 회사 킨트랜스(KinTrans)처럼 수화 이용자의 영상을 자동으로 자막을 처리 하는 방법을 연구했다.

그러나 수화를 자동으로 텍스트나 음성으로 번역하는 포괄적인 방법을 연구하는 것은 여전히 어렵다.

카네기 멜론 대학의 인간과 컴퓨터 상호작용 전문가인 제프리 빅함은 싱이 개발한 시스템이 "(수화 인식) 개념을 증명한 훌륭한" 시스템이지만, "아직 갖춰지지 않은 수준의 컴퓨터 수준과 언어를 모두 요구하기 때문에" 수화를 완벽하게 이해할 수 있는 시스템을 개발하는 것은 어렵다고 말했다.

빅함은 "알렉사는 아직 영어도 제대로 이해하지 못한다"며 현재 알렉사와 같은 음성비서 시스템은 일부의 언어만을 이해한다는 점을 지적했다.

영국 청각장애인협회의 에어인 잭슨은 음성지원 기술 발전으로 수화를 사용하는 청각장애인이 도태되고 있다고 말했다.

잭슨은 "이런 기술발전이 세상을 형성하고 있고, 청각장애인을 위한 언어 접근에 대해 창의적인 해결방안을 마련해야 한다"고 말했다.

그는 수화 인식 장갑부터 수화 아바타까지 많은 유사 프로젝트에 주목하고 있지만, 수화 문법을 인식하는 데에 어려움이 있다는 것을 지적한다. 수화는 손의 움직임뿐만 아니라 얼굴 움직임에 따라서도 의미가 달라지기 때문이다.

잭슨은 "우리는 기업 모두가 청각장애인을 고려한 기술을 개발할 것을 촉구하고, 이러한 문제에 주목하는 싱과 같은 개발자를 응원한다"고 말했다.

아마존은 앞으로 더 많은 알렉사 사용자에게 화면을 장착할 수 있는 옵션을 부여할 것이라고 발표했다.

작성자 정보

BBC News | 코리아

    실시간 인기

      번역중 Now in translation
      잠시 후 다시 시도해 주세요 Please try again in a moment