當前位置:編程學習大全網 - 編程語言 - 語音編碼的編碼的分類

語音編碼的編碼的分類

語音編碼就是對模擬的語音信號進行編碼,將模擬信號轉化成數字信號,從而降低傳輸碼率並進行數字傳輸,語音編碼的基本方法可分為波形編碼、參量編碼(音源編碼)和混合編碼,波形編碼是將時域的模擬話音的波形信號經過取樣、量化、編碼而形成的數字話音信號,參量編碼是基於人類語言的發音機理,找出表征語音的特征參量,對特征參量進行編碼,混合編譯碼是結合波形編譯碼和參量編譯碼之間的優點。波形編譯碼器雖然可提供高話音的質量,但數據率低於16kb/s的情況下,在技術上還沒有解決音質的問題。 基本原理是在時間軸上對模擬話音信號按照壹定的速率來抽樣,然後將幅度樣本分層量化,並使用代碼來表示。在接收端將收到的數字序列經過解碼恢復到原模擬信號,保持原始語音的波形形狀。話音質量高,編碼速率高。如PCM編碼類(a率或u率PCM、ADPCM、ADM),編碼速率為64-16kb/s,語音質量好。

波形編碼的目的在於盡可能精確地再現原來的語音波形,並以波形的保真度即自然度為其質量的主要度量指標,但波形編碼所需的碼速率較高。 根據語音信號產生的數學模型,通過對語音信號特征參數的提取後進行編碼(將特征參數變換成數字代碼進行傳輸)。在接收端將特征參數,結合數學模型,恢復語音,力圖使重建語音保持盡可能高的可懂度,重建語音信號的波形同原始語音信號的波形可能會有相當大的區別。如線性預測(LPC)編碼類。編碼速率低,2.4-1.2kb/s,自然度低,對環境噪聲敏感。

這種語音編碼的主要質量指標是可懂度,參量編碼可以將語音編碼以後的速率壓得很低。 將波形編碼與參數編碼相結合,在2.4-1.2kb/s速率上能夠得到高質量的合成語音。混合編碼把波形編碼的高質量和參量編碼的高效性融為壹體,在參量編碼的基礎上附加壹定的波形編碼特征,實現在可懂度的基礎上適當地改善自然度的目的。

用於移動通信中的語音編碼壹般都是混合編碼。選擇混合編碼時,要使比特率、質量、復雜度和處理時延這4個參量及其關系達到綜合最佳化。 語音中最基本的元素是音素,大約有128~256個,如果按通常的說話速度,每秒平均發出10個音素,則信息率為:I=[log2(256)10]bps=80bps

把發音看成是以語音速率來傳送,則語音編碼的極限速率為80bps,從數字化標準的編碼速率64kbps,到極限速率80bps,之間的距離,對於理論研究和實踐有著極大的吸引力。

  • 上一篇:數控加工的編程思路
  • 下一篇:高中生如何才能學好軟件開發?
  • copyright 2024編程學習大全網