본문 바로가기

댓글0
번역beta

Translated by kakao i

번역할 언어 선택

뷰 본문

BIZION

AI로 고품질의 화상회의 서비스를 구현한 엔비디아

AI 알고리즘 기반의 화상회의 솔루션 'NVIDIA Maxine'

403 읽음
댓글0
번역beta

Translated by kakao i

번역할 언어 선택
AI 알고리즘으로 실시간 영상의 품질을 높이다

최근 글로벌 기업 엔비디아(NVIDIA)가 인공지능(AI) 화상회의 솔루션 '맥신(Maxine)'을 공개했다. 놀라운 점은 맥신이 줌과 같은 일반 화상회의 솔루션과 달리 AI 알고리즘을 통해 다양한 기능을 제공하고 있다는 점이다.


맥신은 엔디비다 그래픽처리장치(GPU)로 구동할 수 있으며 AI 기술을 활용해 '시선교정', '페이스 리라이팅(Face rewriting)', '노이즈 캔슬링', '얼굴 얼라인먼트(Face alignment)' 등의 기능을 제공한다.

가장 두드러진 기능을 하나 꼽자면 '페이스 리라이팅' 기능으로 인터넷 환경이 좋지 않은 곳에서 발생하는 저화질의 얼굴 영상을 인공지능을 활용한 비디오 압축 기술을 이용해 실시간 선명한 얼굴로 바꾸어 스트리밍해주는 기능이다.


이는 얼굴을 스캔해 미세한 얼굴 움직임을 나타내는 포인트를 식별하고 정지된 얼굴 이미지를 결합하는 딥페이크(Deepfake) 기술의 일종으로 화자의 얼굴을 재생생하는 기술이다. 

AI 기술로 더욱 정확한 의사소통을 지원하다

더욱 놀라운 점은 '시선교정' 기능으로 마스크를 쓰고 있거나 안경을 착용해도 상관없으며, 얼굴의 각도를 바꿔서 마주 보는 것처럼 바꾸고 시선을 보정해주기도 한다. 

화상회의의 대면성을 강화하기 위해 얼굴을 맞대고 대화하는 듯한 느낌도 기술적으로 구현했다. 바로 페이스 얼라인먼트(Face alignment) 기능으로 통화 중에 서로 마주보는 것처럼 얼굴을 조정해준다.


또한 사용자가 실시간으로 음성과 감정 톤에 따라 자동으로 움직이는 애니메이션으로 자신만의 아바타를 선택할 수 있는 기능도 추가할 수 있도록 했다. 얼굴 보여주기가 어려운 상황에서 이용하기 좋은 기능이다. 

마지막으로 노이즈 캔슬링 기술은 말 그대로 주위의 듣기 싫은 소음을 깔끔하게 없애고 사용자의 목소리만을 캐치해 들려주는 기술을 적용해 상대와 더욱 원활한 소통을 가능하게 해준다.


커뮤니케이션에 있어 눈빛과 표정으로 감정을 전달할 수 있는 얼굴의 역할은 절대적이다. 인공지능을 이용한 실시간 그래픽 처리 기술로 다양한 인터넷 환경에서도 정확한 의사소통을 지원하는 맥신, 앞으로 줌, 구글 등의 화상회의 솔루션들과의 경쟁에서 살아남을 수 있을지 계속 지켜보기 바란다.


작성자 정보

    실시간 인기

      번역중 Now in translation
      잠시 후 다시 시도해 주세요 Please try again in a moment