語音識別模組
語音識別模組是我司自主研發的一套基于云和端的通用智能語音解決方案。該模組可以為客戶提供從從語音檢測(VAD)、語音識別(ASR)、通話降噪(ENC)、主動降噪(ANC)、音效、以及軟硬件系統集成在內的全套語音物聯網解決方案,具有開發周期短、低功耗、低成本、和通過云端應用服務及軟件版本升級實現產品服務和產品快速升級迭代的特點。
應用
● 智能音箱
● 智能穿戴
● 智能玩具
● 智能車載
● 智能健康
● 智能家居
● 手機、電腦
方案特點
● 支持語音前端處理功能:降噪(NS)處理、回聲消除(AEC)、語音端點檢測(VAD)、波束形成(Beam forming )、自動增益控制(AGC)
● 支持特征提取功能:采用梅爾頻率倒譜系數(MFCC)
● 支持語音識別功能:采用基于神經網絡模型(DNN)的端到端(end to end)的語音識別模式, 具有語音識別率高(識別率>95%)、Memory占用資源相對較少(可在MCU嵌入式系統中工作)、語料準備簡單、訓練周期短的特點;支持喚醒詞條和命令詞條,不限語言類型,可以中文+外語、普通話+方言。
● 支持遠場語音識別,語音增強技術讓識別效果更好,喚醒環境無需安靜,說話不用靠近
● 通過麥克風陣列實現復雜噪聲環境下的拾音
● 獨立喚醒模塊,支持UART等常用通信接口,當模塊喚醒或識別到命令時,通過接口告知客戶的設備
● 支持算法定制和調整
● 可根據客戶硬件資源以及應用場景定制lib庫
● 內存開銷小,可通用于各種MCU/DSP平臺
● 超低功耗,待機時CPU無需做語音降噪和激活
● 客戶支持完善
自主算法
AUTONOMOUS ALGORITHM