語音編碼的編碼的分類

語音編碼就是對模擬的語音信號進行編碼，將模擬信號轉化成數字信號，從而降低傳輸碼率並進行數字傳輸，語音編碼的基本方法可分為波形編碼、參量編碼（音源編碼）和混合編碼，波形編碼是將時域的模擬話音的波形信號經過取樣、量化、編碼而形成的數字話音信號，參量編碼是基於人類語言的發音機理，找出表征語音的特征參量，對特征參量進行編碼，混合編譯碼是結合波形編譯碼和參量編譯碼之間的優點。波形編譯碼器雖然可提供高話音的質量，但數據率低於16kb/s的情況下，在技術上還沒有解決音質的問題。基本原理是在時間軸上對模擬話音信號按照壹定的速率來抽樣，然後將幅度樣本分層量化，並使用代碼來表示。在接收端將收到的數字序列經過解碼恢復到原模擬信號，保持原始語音的波形形狀。話音質量高，編碼速率高。如PCM編碼類（a率或u率PCM、ADPCM、ADM)，編碼速率為64－16kb/s，語音質量好。

波形編碼的目的在於盡可能精確地再現原來的語音波形，並以波形的保真度即自然度為其質量的主要度量指標，但波形編碼所需的碼速率較高。根據語音信號產生的數學模型，通過對語音信號特征參數的提取後進行編碼（將特征參數變換成數字代碼進行傳輸）。在接收端將特征參數，結合數學模型，恢復語音，力圖使重建語音保持盡可能高的可懂度，重建語音信號的波形同原始語音信號的波形可能會有相當大的區別。如線性預測（LPC）編碼類。編碼速率低，2.4-1.2kb/s，自然度低，對環境噪聲敏感。

這種語音編碼的主要質量指標是可懂度，參量編碼可以將語音編碼以後的速率壓得很低。將波形編碼與參數編碼相結合，在2.4-1.2kb/s速率上能夠得到高質量的合成語音。混合編碼把波形編碼的高質量和參量編碼的高效性融為壹體，在參量編碼的基礎上附加壹定的波形編碼特征，實現在可懂度的基礎上適當地改善自然度的目的。

用於移動通信中的語音編碼壹般都是混合編碼。選擇混合編碼時，要使比特率、質量、復雜度和處理時延這4個參量及其關系達到綜合最佳化。語音中最基本的元素是音素，大約有128～256個，如果按通常的說話速度，每秒平均發出10個音素，則信息率為：I=[log2(256)10]bps=80bps

把發音看成是以語音速率來傳送，則語音編碼的極限速率為80bps,從數字化標準的編碼速率64kbps，到極限速率80bps，之間的距離，對於理論研究和實踐有著極大的吸引力。

上一篇:數控加工的編程思路

下一篇:高中生如何才能學好軟件開發？

貴州興義自駕遊旅遊指南貴州興義旅遊指南路線

西門子PLC模擬量輸入A+A-是什麽意思?

請教UG的優點

什麽是psr-0，psr-1，psr-2標準

馬斯克的成長歷程？

linuxc編程實戰linuxc編程視頻

模型建立的方法和步驟