동문소식

최근 소식

문맥 읽고 감정 담아 이야기하는 ‘즐거운 AI’, 김태수 네오사피엔스 대표
  • 총동문회관리자
  • 2023-01-19
  • 조회수  29
#가상현실(VR) 속, 좋아하는 연예인과 마주 앉은 상태로 ‘나만을 위한’ 인터뷰가 시작된다. 최근 발매한 앨범에 대해 들뜬 목소리로 빠르게 소개를 이어가던 그에게 평소 궁금했던 루머에 관해 묻자, 진지하고 심각한 목소리로 천천히 답을 한다. 대뜸 화를 내자 당황한 목소리가 튀어나오고, 재미있는 이야기에는 박장대소를 하기도 한다. 맥락과 내용에 따라 다양한 감정을 드러내는 이 목소리는, 사람이 직접 녹음한 목소리가 아닌 인공지능(AI)의 연기 실력이다. 이와 같은 체험을 가능하게 하는 곳은 김태수(40) 대표가 이끄는 3년차 스타트업 네오사피엔스다. 김 대표는 “현재 AI 스피커 음성이 책을 읽는 수준이라고 하면, 우리의 기술은 특정 목소리에 감정을 담아 연기를 하는 것”이라며 “AI가 개성을 가지면 사람들에게 ‘맞춤형 즐거움’을 제공할 수 있다”고 말했다. 학창시절부터 ‘소리를 전기 신호에 잡아두는’ 전기 기타의 원리를 궁금해했던 김 대표는 카이스트 석ㆍ박사 과정에 걸쳐 음성과 인공신경망(AI 학습 알고리즘)을 연구했다. 음성으로 집안 불을 켜거나 끄고, 음악소리를 인식해 어떤 음악인지 찾는 등 현재 널리 쓰이는 기술을 개발한 게 김 대표가 대학원생이던 2001년쯤이었다. 그러나 당시만 해도 시장에서는 음성인식 기술의 필요성을 전혀 느끼지 못했다. 김 대표가 기술뿐 아니라 시장성과 사용자에 대해서도 고민하게 된 계기다. 이후에도 비슷한 일이 계속됐다. 박사 과정을 마치고 LG전자에 근무할 때 쓴 목소리 추출 기술에 관한 논문은 세계적으로 290여회나 인용될 정도로 ‘히트’를 쳤지만, 정작 상업적으로는 성공하지 못했다. 이후 퀄컴에 입사해 특정 키워드를 발음하면 기기가 켜지는 ‘웨이크업 콜’을 개발했지만 이것도 애플이 음성 비서 ‘시리’를 내놓고 아마존이 ‘알렉사’를 출시한 뒤에야 본격적으로 시장이 열렸다. 국내에서 무시 받던 음성인식 분야가 본격적으로 주목 받기 시작한 것도 구글이 음성검색 서비스를 시작하고 나서였다. 김 대표는 “세상에 영향을 미치려면 단순히 기술을 개발하는 걸 넘어 트렌드를 이끌어야 한다는 걸 깨달았다”면서 “그게 잘 다니던 회사를 퇴사하고 스타트업을 창업한 이유”라고 말했다.