FRONICS
게시판

투자 정보

게시판

제목 카이스트, ‘인간 달팽이관’ 모사한 초고감도 인공지능 음성인식 기술 제품화 성공

 

 

이기종 기자= 한국과학기술원(KAIST)은 신소재공학과 이건재 교수와 왕희승 박사팀이 공진형 유연 압전 음성 센서를 개발한 후 이를 스마트폰과 인공지능 스피커에 탑재해 제품화하는 데도 성공했다고 15일 밝혔다.

음성을 통해 주변 스마트 기기와 양방향 의사소통하는 기술은 가장 직관성이 높으며 최근 AI 스피커 및 사물인터넷용 전자 기기 시장의 증대로 센서의 중요성이 더욱 커지고 있다.

이번 연구팀은 센서 구조에 따른 공진, 주파수, 압전 막의 역할 등을 이론적으로 밝히고 크기를 매우 소형화함과 동시에 성능이 향상된 음성 센서를 개발했다.

연구과정을 보면 지난 2019년도에 이건재 교수팀이 세계 최초로 개발한 유연압전 기반 공진형 음성 센서는 크기가 크다는 한계가 있어 상용 전자회로와 시스템적으로 통합될 수 없고 모바일용 제품에 적용되지 못했다. 

공진이란 특정 주파수 영역에서 센서가 큰 진폭으로 진동하는 현상을 말하며 압전이란 압력을 가했을 때 전기적인 신호가 자발적으로 생성되는 현상을 말한다.

공진형 압전 음성 센서는 음성에 의해 센서의 막이 진동하게 될 때 공진 현상이 일어나 민감도 높은 전압 신호를 얻을 수 있다.

또 인간이 먼 거리의 소리를 인식하는 방법은 달팽이관에 있는 사다리꼴 막이 가청주파수 대역에서 수많은 공진 현상을 발생시키며 소리를 증폭하는 원리에 있다.

이번 연구에서는 이러한 원리의 효과를 극대화하기 위해 매우 얇은 유연 압전 막을 사용해 인간의 귀를 모사했고 여러 공진 채널을 구현해 소리를 초고감도로 식별할 수 있는 공진형 음성 센서를 제작했다.

특히 생체 모사된 공진형 음성 센서는 신호 대 잡음비(Signal to noise ratio, SNR)가 우수해 음성인식 기능이 뛰어나고 다수 채널을 보유하기 때문에 인공지능 음성 서비스에 적은 데이터양으로도 화자 식별 정확도를 높이는 강점이 있다.

이 연구결과에 의하면 같은 조건에서 정전용량형 상용 마이크로폰과 성능 비교해 음성 분석 및 화자 식별에 있어 인식률을 크게 높였고 조건에 따라 오류율을 60%에서 95%까지 줄일 수 있었다.

한편 이 교수가 교원 창업한 기업인 ㈜프로닉스는 시제품을 2020년 세계 가전박람회(CES)에서 공개했고  ㈜프로닉스 미국 지사를 통해 실리콘밸리의 유수 IT 기업들과 협업도 추진하고 있다.

이건재 교수는 “이번에 제품화된 모바일 음성 센서는 높은 민감도를 보유하면서도 크기를 획기적으로 줄였기 때문에 미래 인공지능기술을 구동하는 핵심 센서로 적용할 수 있다”며 “현재 대량생산 상용화 공정도 완성 단계에 있어 실생활에 곧 적용될 수 있을 것”이라고 말했다.

이 연구는 한국연구재단의 휴먼플러스 인공지능 센서 센터의 지원을 받아 수행됐고 국제 학술지 사이언스 어드밴시스(Science Advances)에 2월 12일 게재됐다.


 

Link
FileDownload
TOP