FRONICS
보이스센서

보이스센서

보이스 센서
프로닉스의 보이스 센서는 인간이 소리를 듣는 방식을 모사하여 AI와의
소통을 목적으로 만든 세계 유일의 화자식별이 가능한 음성인식 센서 입니다.

프로닉스는 유연한 압전 물질을 자체 개발, 활용하여 인식률을 획기적으로 높인 보이스 센서인 ‘유연 압전 음성 센서(f-PAS)’를 개발 하였습니다. 프로닉스의 보이스 센서는 인간의 달팽이관에 있는 기저막(BM)의 음성인식 원리를 모사하여 사다리꼴 모양의 얇은 막 형태로 제작되었으며, 음성의 주파수 대역 별로 공진하는 유연 압전 막을 통해 들어오는 음성신호를 읽어 정밀하고 민감하게 음성을 인식할 수 있도록 구현한 보이스 센서입니다.

주요 기술 차이점
멀티채널

기존의 마이크로폰 센서와 다르게 유연 압전 음성 센서(f-PAS)는 음성이 발화하면 음성의 주파수 별로 각 채널이 공진 하며 전류가 발생됨으로 전력 공급 없이 자가 구동(Always-on)이 가능합니다. 그리고 기존 마이크로폰 센서는 약 3미터 정도까지 음성을 인식할 수 있지만 프로닉스의 유연 압전 음성 센서(f-PAS)는 기존 마이크로폰 대비 2~4배 더 먼 거리에서도 음성을 인식할 수 있습니다. 또한 유연 압전 음성 센서(f-PAS)는 여러 채널로 신호를 받기 때문에 하나의 음성에 대해 복수의 데이터를 얻을 수 있습니다. 이는 화자 식별 및 음성 인식의 오류를 획기적으로 줄여 향후 화자 식별 음성 인식 서비스를 적용한 스마트 홈오토메이션, 인공지능 비서, 자율 구동 자동차, 생체 인증 보안 분야 등과 접목되어 혁신적인 미래를 보여줄 것입니다.

주요 기술 차이점
효과

기존 마이크로폰 센서와 비교하여 프로닉스 f-PAS(유연 압전 음성 센서)의 효과를 입증하기 위해 ‘S사’ 핸드폰에 사용되고 있는 마이크로폰 센서 중 하나인 ‘K사’의 SPH****센서와 비교하는 실험을 진행하였습니다. 화자 40명을 대상으로 각자 70번의 음성 발화를 이용해 트레이닝 데이터 베이스를 만들고, 트레이닝 시 사용되지 않은 각 화자의, 7번의 다른 음성 발화를 실험한 결과, 화자 인식률에 있어 프로닉스의 보이스 센서가 에러율을 75% 감소시켰습니다.

Noise Robust Speaker Recognition
– CNN (Deep Learning)

  • Under harsh noise condition
    f-PAS: 26 % reduction
    Commercial MEMS: 65% reduction

Wolverine – IVA (Conventional)

Simulation Result

Voice+noise mixture

  • Speaker A

  • Speaker B

Algorithm : Independent Vector Analysis (IVA) for source separation

Experimental Condition : 2 speakers + crowd (12 background speakers)

Noise Filtering
– DEMUCS (Deep Learning)

Experimental Result

  • Noisy Signal

  • Clean Signal

Experimental Condition

Mixture : voice + alarm noise

Intensity : Noise is 1.8 times higher than voice

보이스 센서
응용 분야

보이스센터는 다양한 분야에서 새로운 수익을 창출하고 있습니다. 미래 산업을 주도할 빅데이터, 사물인터넷 분야의 스마트가전, 스마트자동차, 스마트디바이스, 스마트홈, 스마트팩토리에서부터 가상현실, 방위산업까지 미래의 4차 산업을 주도하는 가장 핵심적인 산업이라고 할 수 있습니다.

TOP