語音識別系統的原理

語音識別系統是壹種模式識別系統，包括特征提取、模式匹配、參考模式庫等三個基本單元。未知語音經過話筒變換成電信號後加在識別系統的輸入端，首先經過預處理，再根據人的語音特點建立語音模型，對輸入的語音信號進行分析，並抽取所需的特征，在此基礎上建立語音識別所需的模板。

然後根據此模板的定義，通過查表就可以給出計算機的識別結果。顯然，這種最優的結果與特征的選擇、語音模型的好壞、模板是否準確都有直接的關系。

語音識別系統構建過程整體上包括兩大部分：訓練和識別。訓練通常是離線完成的，對預先收集好的海量語音、語言數據庫進行信號處理和知識挖掘，獲取語音識別系統所需要的“聲學模型”和“語言模型”;而識別過程通常是在線完成的，對用戶實時的語音進行自動識別。

識別過程通常又可以分為“前端”和“後端”兩大模塊：“前端”模塊主要的作用是進行端點檢測(去除多余的靜音和非說話聲)、降噪、特征提取等;“後端”模塊的作用是利用訓練好的“聲學模型”和“語言模型”對用戶說話的特征向量進行統計模式識別，得到其包含的文字信息，此外，後端模塊還存在壹個“自適應”的反饋模塊，可以對用戶的語音進行自學習，從而對“聲學模型”和“語音模型”進行必要的“校正”，進壹步提高識別的準確率。

自動語音識別技術有三個基本原理：首先語音信號中的語言信息是按照短時幅度譜的時間變化模式來編碼;其次語音是可以閱讀的，即它的聲學信號可以在不考慮說話人試圖傳達的信息內容的情況下用數十個具有區別性的、離散的符號來表示;第三語音交互是壹個認知過程，因而不能與語言的語法、語義和語用結構分開來。

上一篇:什麽是百搭包

下一篇:谷姐的基本簡介