當前位置:編程學習大全網 - 編程語言 - 語音識別芯片的語音識別系統設計

語音識別芯片的語音識別系統設計

對於嵌入式系統而言,語音識別硬件組成要考慮很多其它因素,首先由於成本的限制,壹般使用定點DSP,這意味著算法的復雜度受到限制;其次,對產品化有各種嚴格的限制,這就需要壹個高度集成的硬件DSP,因此最理想的硬件組成是系統級的芯片。

壹般采用的是壹個16位結構的微控制器,將MCU、A/D、D/A、RAM、ROM集成在壹塊芯片上,具有很高的集成度。同時具有較高運算速度的16×16位的乘法語音和內積運算指令,CPU最高可達時鐘49MHz,因此在復雜的數字信號處理方面既非常便利又比專用的DSP芯片便宜得多。並具有12位ADC,和14位DAC保證音頻精度,配置帶自動增益控制(AGC)的麥克風輸入方式,為語音處理帶來了極大的方便。既具有體積小、集成度高、可靠性好的特點,又具有較強的中斷處理能力、高性能的價格比和功能強、效率高的指令系統及低功耗、低電壓的特點,所以非常適合用於嵌入式語音識別系統。

以SR160X為核心的嵌入式語音識別系統硬件的電路系統,主要包括麥克風輸入電路、ADC、DAC、功放輸出電路、鍵盤電路和各種通信電路等,語音保存到SPI Flash存儲器中。 非特定人語音識別要經過語音訓練後才能識別,將語音訓練過程中建立的參考模式庫和從待識別語音信號中提取的特征參數都存放在外擴的SPI Flash中,這樣就可以保證掉電後重新開機繼續識別。語音識別系統軟件主程序由語音訓練程序、語音識別程序、語音播放程序、中斷程序、初始化程序等子程序組成。由於嵌入式平臺存儲資源少、實時性要求高的特點,因此算法在保證識別效果的前提下要盡可能優化。

軟件包括A/D變換、預加重、分幀和加窗、端點檢測、特征參數提取、放寬端點限制的DTW算法,最後識別結果輸出。

在應用層軟件考慮到用戶的實際需求,增加了能快速開發的虛擬軟件開發技術,能快速完成產品。

  • 上一篇:解決計算機形態學習題
  • 下一篇:初級測試工程師
  • copyright 2024編程學習大全網