當前位置:編程學習大全網 - 源碼下載 - HTML5語音識別原理是什麽?可以很簡單實現,但是具體原理是怎麽樣的?

HTML5語音識別原理是什麽?可以很簡單實現,但是具體原理是怎麽樣的?

原理:

主流的大詞匯量語音識別系統多采用統計模式識別技術。典型的基於統計模式識別方法的 語音識別系統由以下幾個基本模塊所構成:

信號處理及特征提取模塊。該模塊的主要任務是從輸入信號中提取特征,供聲學模型處理。同時,它壹般也包括了壹些信號處理技術,以盡可能降低環境噪聲、信道、說話人等因素對特征造成的影響。

統計聲學模型。典型系統多采用基於壹階隱馬爾科夫模型進行建模。

發音詞典。發音詞典包含系統所能處理的詞匯集及其發音。發音詞典實際提供了聲學模型建模單元與語言模型建模單元間的映射。

語言模型。語言模型對系統所針對的語言進行建模。理論上,包括正則語言,上下文無關文法在內的各種語言模型都可以作為語言模型,但目前各種系統普遍采用的還是基於統計的N元文法及其變體。

解碼器。解碼器是語音識別系統的核心之壹,其任務是對輸入的信號,根據聲學、語言模型及詞典,尋找能夠以最大概率輸出該信號的詞串。

以上是語音識別的各個組成部分,而離線的語音識別,應該也是基於以上的原理,而且在手機內部內置了語音的字典,從而實現無線的識別

如:

1、瀏覽器提供的功能,比如chrome,如果沒有提供的話就不能用。

2、具體實現的細節主要是chrome的離線語音識別引擎。

3、調用系統api,瀏覽器是個app,可以訪問所有底層的api,只要系統提供就可以實現。

相關代碼如下:

<!DOCTYPE HTML> < html> < head> < title>簡單通過html5實現語音識別</title> < script> if (document.createElement(“input”).webkitSpeech === undefined) { alert(“Speech input is not supported in your browser.”); } < /script> < /head> < body>

<input type=”text” name=”value_2″ x-webkit-speech/>

</body> < /html>

  • 上一篇:超買區的相關詞語
  • 下一篇:龐大的算術源代碼
  • copyright 2024編程學習大全網