프로닉스는 유연한 압전 물질을 자체 개발, 활용하여 인식률을 획기적으로 높인 보이스 센서인 ‘유연 압전 음성 센서(f-PAS)’를 개발 하였습니다. 프로닉스의 보이스 센서는 인간의 달팽이관에 있는 기저막(BM)의 음성인식 원리를 모사하여 사다리꼴 모양의 얇은 막 형태로 제작되었으며, 음성의 주파수 대역 별로 공진하는 유연 압전 막을 통해 들어오는 음성신호를 읽어 정밀하고 민감하게 음성을 인식할 수 있도록 구현한 보이스 센서입니다.
기존의 마이크로폰 센서와 다르게 유연 압전 음성 센서(f-PAS)는 음성이 발화하면 음성의 주파수 별로 각 채널이 공진 하며 전류가 발생됨으로 전력 공급 없이 자가 구동(Always-on)이 가능합니다. 그리고 기존 마이크로폰 센서는 약 3미터 정도까지 음성을 인식할 수 있지만 프로닉스의 유연 압전 음성 센서(f-PAS)는 기존 마이크로폰 대비 2~4배 더 먼 거리에서도 음성을 인식할 수 있습니다. 또한 유연 압전 음성 센서(f-PAS)는 여러 채널로 신호를 받기 때문에 하나의 음성에 대해 복수의 데이터를 얻을 수 있습니다. 이는 화자 식별 및 음성 인식의 오류를 획기적으로 줄여 향후 화자 식별 음성 인식 서비스를 적용한 스마트 홈오토메이션, 인공지능 비서, 자율 구동 자동차, 생체 인증 보안 분야 등과 접목되어 혁신적인 미래를 보여줄 것입니다.
기존 마이크로폰 센서와 비교하여 프로닉스 f-PAS(유연 압전 음성 센서)의 효과를 입증하기 위해 ‘S사’ 핸드폰에 사용되고 있는 마이크로폰 센서 중 하나인 ‘K사’의 SPH****센서와 비교하는 실험을 진행하였습니다. 화자 40명을 대상으로 각자 70번의 음성 발화를 이용해 트레이닝 데이터 베이스를 만들고, 트레이닝 시 사용되지 않은 각 화자의, 7번의 다른 음성 발화를 실험한 결과, 화자 인식률에 있어 프로닉스의 보이스 센서가 에러율을 75% 감소시켰습니다.
Noise Robust Speaker Recognition
– CNN (Deep Learning)
Wolverine – IVA (Conventional)
Algorithm : Independent Vector Analysis (IVA) for source separation
Experimental Condition : 2 speakers + crowd (12 background speakers)
Noise Filtering
– DEMUCS (Deep Learning)
Mixture : voice + alarm noise
Intensity : Noise is 1.8 times higher than voice
보이스센터는 다양한 분야에서 새로운 수익을 창출하고 있습니다. 미래 산업을 주도할 빅데이터, 사물인터넷 분야의 스마트가전, 스마트자동차, 스마트디바이스, 스마트홈, 스마트팩토리에서부터 가상현실, 방위산업까지 미래의 4차 산업을 주도하는 가장 핵심적인 산업이라고 할 수 있습니다.