음성만 있나? 보는 인공지능 '비전 AI'의 현재

조회수 2018. 8. 9. 08:10 수정
번역beta Translated by kaka i
번역중 Now in translation
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 다양한 분야의 재밌고 유익한 콘텐츠를 카카오 플랫폼 곳곳에서 발견하고, 공감하고, 공유해보세요.

'비전 AI'라고 불리는 보는 인공지능에 대해 파헤쳐보자.

흔히 기계에 관심이 없다고 하는 사람들도 시리, 빅스비, 그리고 구글 어시스턴트는 한번쯤 들어봤을 정도로 대중적으로도 인지도가 있는 AI, 즉 인공지능 비서다. 이들의 공통점은 음성을 기반으로 명령을 수행하고 응답하는 ‘음성’ 인공지능이라 할 수 있다. 그런데 우리들의 스마트폰에는 사람들이 잘 모르는 인공지능이 하나 더 있다. 들을 줄 알고 말할 줄 아는 인공지능 외에도, 볼 줄 아는 인공지능이 그 주인공이다. 통상적으로 ‘비전 AI’라고 불리는 보는 인공지능에 대해 파헤쳐보자.


스마트폰 속 비전 AI

현재 우리가 스마트폰으로 만나볼 수 있는 대표적인 비전 AI는 빅스비 비전, 구글렌즈, Q렌즈 등이 있다. 아직 아이폰에는 공식적으로 기본 카메라에 비전 AI가 탑재되지는 않았지만 별도의 앱을 설치하면 비전 AI를 이용할 수 있다. 

▲ 빅스비 비전

빅스비 비전은 삼성전자가 내놓은 비전 AI로, 다양한 인공지능 기술들을 선보이는 것이 특징이다. 대표적으로 텍스트를 비췄을 때, 원하는 언어로 실시간 번역해주는 기능이 있다. 해외여행을 갈 때나 원어로 된 전공 서적을 공부할 때나 매우 유용하게 쓸 수 있다. 여기에 내가 있는 장소와 내가 먹는 음식, 그리고 내가 좋아하는 연예인을 빅스비 비전으로 비추는 것만으로 다양한 추가 정보를 얻을 수 있다. 특히 친구가 산 가방을 사고 싶다면, 빅스비 비전으로 친구 가방을 비추기만 해도 쇼핑 정보가 뜨니, 정말 똑똑한 비전 AI라 할 수 있겠다. 

▲ LG의 비전 AI

그 다음으로 LG전자의 스마트폰에 탑재되는 비전 AI는 크게 AI카메라, Q렌즈가 있다. AI카메라는 실행과 동시에 스스로 피사체를 인식해 밝기나 대비를 조절해 최적의 촬영 모드를 적용해주는 기능이다. 특히 LG G7 씽큐에는 ‘슈퍼 브라이트 카메라’ 기능이 더해졌는데, 어두운 공간에서 그 정도를 스스로 분석해 기존보다 2배까지 밝은 사진을 촬영할 수 있게 해준다. Q렌즈는 카메라로 사진을 찍으면 피사체의 정보나 관련 제품을 바로 구매할 수 있는 기능의 비전 AI다. 

▲ 구글 렌즈

구글 어시스턴트를 지원하는 스마트폰이라면 사용할 수 있는 비전 AI가 바로 구글 렌즈다. 구글 렌즈는 과거에는 강아지와 머핀을 구분해내지 못해 조롱의 대상이기도 했지만, 지금은 비전 AI의 대표주자라 할 수 있을 정도로 크게 발전한 모습을 보여주고 있다. 식당 간판을 카메라로 비추면 식당의 메뉴와 별점을 확인할 수 있고, 사고 싶은 옷을 비추면 그와 비슷한 다양한 옷을 찾아주는 등 그 반응 또한 갈수록 빨라지고 있다. 구글의 방대한 데이터가 구글 렌즈의 기반이 되니, 못 찾는 게 없을 정도가 아닐까 싶다. 


기업들도 비전 AI에 주목한다

▲ 네이버 스마트렌즈

네이버는 ‘스마트렌즈’ 서비스로 사용자 편의성을 크게 높였다. 스마트렌즈는 네이버가 개발한 기술로 만든 비전 AI 서비스인데, 네이버 앱 검색창에 뜨는 카메라 버튼을 누르기만 하면 서비스를 이용할 수 있다. 구글렌즈나 빅스비 비전과 마찬가지로 피사체의 종류를 빠르게 인식하고, 각종 정보를 자세히 알려준다. 최근 네이버는 글로벌 ‘컴퓨터 비전 및 패턴 인식’ 컨퍼런스에 참여해 비전 AI에 관련한 포부를 간접적으로 밝혔으며, 관련 인재 영입에도 힘쓰고 있는 것으로 알려졌다.

▲ 현재 카카오톡 내 '이미지로 검색' 서비스를 이용할 수 있다

또 꼭 스마트폰에 기본으로 탑재되는 비전 AI가 아니더라도, 우리가 쉽게 접하는 다양한 서비스에서 비전 AI를 만나볼 수 있다. 카카오의 경우 고객에게 직접적으로 제공하는 서비스를 제공하기에 앞서 비전 AI가 활용된 케이스라 할 수 있다. 다음 로드뷰를 업데이트하는 과정에서 불가피하게 촬영된 차량들의 번호판을 가리기 위해 번호판만 검출해 일괄적으로 블러 처리하는 작업을 거쳤는데, 이 과정에서 바로 비전 AI가 쓰였다. 네이버의 스마트렌즈와 같은 비전 AI 고객 서비스도 연내 공개할 예정이라고 하니 기대해도 좋을 것 같다.

▲ SK C&C가 제공하고 있는 얼굴 인식 API

좀 더 기술적으로 들어가보자. 지금까지 소개한 비전 AI는 대부분 객체 인식에 집중했다면, 비전 AI가 또 활발히 쓰이는 영역이 바로 얼굴 인식이다. SK C&C가 바로 이 얼굴 인식 비전 AI를 활용할 수 있는 API를 제공하고 있다. 얼굴 인식 API를 이용하면 백화점이나 놀이공원 등에서 아이를 잃어버렸을 때, 아이 사진만으로 아이의 현재 위치를 CCTV로 즉각적으로 알아낼 수 있게 된다. 보안 시설 출입 관리나 침입자 감지에도 유용하게 쓰일 것으로 보인다. 


활용 가능성 무궁무진해

▲ 얼굴 인식 API의 활용 분야는 무궁무진하다

마트나 백화점 등 많은 사람을 수용하는 대형 시설에서는 고객이 시설에 출입하는 순간부터 고객의 성별이나 연령을 추정할 수 있어 방문 고객을 보다 쉽게 분석할 수 있다. 이 외에도 보얀 분야, 얼굴 기반 검색 분야 등 다양한 영역에서 얼굴 인식 서비스를 활용할 수 있다. 

▲ 아마존의 비전 AI '에코 룩'

비전 AI는 아직 많은 사람들이 이용하진 않지만, 음성 AI보다 훨씬 빠르게 많은 사람들이 이용하게 될 것으로 보인다. 음성 AI와 달리 비전 AI는 사람이 많은 곳에서도 부담 없이 사용할 수 있고, 그 정확도 역시 사람마다 천차만별인 음성 AI에 비해 더 높다고 볼 수 있다. 점차 쇼핑도 훨씬 빨라지고, 검색도 빨라질 것이다. 비전 AI는 정보량을 음성 AI보다 훨씬 풍성하게 보유하고 있다는 점도 하나의 강점이라 할 수 있다. 


아직 더디지만 성장 가능성 충분해

비전 AI가 아무리 발전 가능성, 활용 가능성이 높다 한들, 여전히 음성 AI와 마찬가지로 부족한 점도 많다. 대부분의 비전 AI는 아직까지 카메라로 비추는 피사체가 어떤 카테고리인지 정도는 쉽게 구별하지만, 피사체의 구체적인 정보까지 바로 알려주는 경우는 많지 않기 때문이다. 실제로 비전 AI 서비스로 카카오프렌즈의 캐릭터 상품을 비춰 봤더니, 해당 상품이 정확히 어떤 건지 캐치하기 보다는 비슷한 캐릭터의 인형을 보여주는 정도에 불과했다. 

▲ 무엇보다 빠르게 발전할 비전 AI

그러나 분명한 건 비전 AI는 빠르게 발전할 것이고, 음성 AI보다도 빠르게 대중화될 것이라는 점이다. 음성 AI가 편한 점도 분명히 있지만, 아직 익숙하지 않은 대중에게는 오히려 더 익숙한 방식의 비전 AI가 더 편하다고 생각할 가능성이 높기 때문이다. 1년만 지나더라도 비전 AI는 굉장히 성장해 있을 것이다. 




최근 인기 IT 동영상 리뷰 보기


이 콘텐츠에 대해 어떻게 생각하시나요?