하이퍼클로바의 '자기지도학습' 딥러닝 기술 도입… "학습 시간 및 비용은 단축" 
클로바노트 서비스에 우선 탑재... "클로바 케어콜 등 다양한 AI 서비스로 확장할 것"

네이버 클로바노트 [네이버 제공]
네이버 클로바노트 [네이버 제공]

네이버가 '하이퍼클로바'의 딥러닝 기술을 음성인식 AI 엔진에도 접목해 성능을 대폭 강화했다고 8일 밝혔다.

네이버는 클로바노트, 클로바 케어콜 등 음성인식 AI를 활용한 여러 서비스에 업그레이드된 엔진을 탑재해 더욱 편리한 사용자 경험을 제공할 예정이다.

​전통적으로 AI 딥러닝은 데이터와 데이터를 설명하는 '레이블(label)'을 쌍으로 학습시키는 '지도학습(supervised learning)' 방식으로 이뤄져왔다. 예를 들면 고양이 이미지와 '고양이'라는 설명을 같이 학습시키는 식이다.

음성인식 AI를 개발하기 위해서는, 음성과 음성 속 텍스트를 같이 학습시켜야 한다. 이러한 '데이터 레이블링'은 사람의 수작업으로 이뤄지기 때문에 학습데이터 구축에 시간과 비용이 많이 든다.

반면, '자기지도학습(self-supervised learning)'은 레이블 없이 데이터 자체만으로 학습할 수 있는 최신 딥러닝 기법으로 학습의 효율성을 훨씬 높일 수 있다. 이는 네이버가 최근 공개한 초대규모(hyperscale) AI '하이퍼클로바'의 핵심 기술이기도 하다.

네이버는 자기지도학습 기법을 AI 음성인식 엔진 'NEST(Neural End-to-end Speech Transcriber)'에도 적용함으로써, 기존 대비 음성인식의 정확도를 약 30% 높였다고 밝혔다.

새로운 학습기법 적용으로 음원 데이터 속 텍스트를 확인하는 전사(transcription) 작업을 최소화하면서도 기존보다 정확한 AI 학습이 가능해져, 모델의 학습 시간 및 비용도 획기적으로 단축됐다. NEST 엔진은 단문 위주의 음성 명령보다 복잡한 장문의 음성 표현을 인식하는데 최적화된 기술로, 네이버가 2020년 4월 처음 공개했다. 

업그레이드된 NEST 엔진은 가장 우선적으로 '클로바노트'에 탑재됐다. 네이버가 작년 말 출시한 음성기록 서비스 클로바노트는 높은 인식률과 편리한 서비스로 사용자들의 호응을 얻으며, 올해 1월 대비 지난 달 사용자 수(MAU)가 2.5배나 증가하는 등 빠른 성장세를 보이고 있다.

최근에는 누적 앱 다운로드가 40만 건을 돌파하기도 했다. 네이버는 클로바노트를 시작으로, AI가 전화로 코로나19 능동감시자를 확인하는 클로바 케어콜, 뉴스 자동 자막 서비스 등 음성인식 AI가 적용된 여러 서비스로 점차 적용을 확대할 예정이다.

한익상 네이버 책임리더는 "네이버는 음성 AI 분야 양대 국제 학회인 'Interspeech'와 'ICASSP'에 올해 각각 9개씩의 논문이 채택되는 등 국내를 넘어 글로벌 최고 수준의 음성기술 경쟁력을 이미 인정받고 있다"면서 "여기에 하이퍼클로바의 기술을 접목시킴으로써, 다양한 음성 AI 서비스의 성능을 더욱 고도화해나갈 것"이라고 말했다. 

저작권자 © 중소기업뉴스 무단전재 및 재배포 금지