當前位置:編程學習大全網 - 編程語言 - 有沒有人知道自適應預測網格編碼量化語音編碼算法的編碼在哪裏有重要的應用及其局限性?

有沒有人知道自適應預測網格編碼量化語音編碼算法的編碼在哪裏有重要的應用及其局限性?

壹種自適應預測網格編碼量化語音編碼算法李泰傑胡光瑞摘要:提出了壹種基於自適應預測網格編碼量化算法的語音壓縮模型。討論了均方誤差意義下最優量化器的設計原理,在研究網格編碼量化算法的基礎上,討論了該模型的編碼器和解碼器的工作原理,重點討論了擴展量化器的集合劃分和卷積碼網格圖的分支標號。計算機仿真結果表明了該模型的有效性和實用性。方差估計;線性預測;隨著通信技術和數字信號處理技術的發展,語音壓縮技術越來越受到重視。目前,混合編碼廣泛應用於中低速率語音編碼,其中波形編碼起著關鍵作用。然而,當普通波形編碼算法的編碼速率低於16 kb/s時,性能急劇下降,如何提高中等速率下波形編碼的性能日益受到人們的關註。因此,本文在網格編碼量化算法[1]的基礎上,提出了壹種自適應預測網格編碼量化(APTCQ)算法模型,該模型基於集合劃分方法[2],使用擴展量化級別的結構化碼書。為了獲得更低的編碼率,APTCQ算法模型1.1的訓練部分的訓練過程如圖1所示。由於語音信號樣本之間的相關性,為了減小量化器的動態範圍,首先使用線性預測(LP)技術來消除樣本之間的相關性。對於得到的殘差序列,使用自適應方差估計[3]進行歸壹化,進壹步縮小信號樣本幅度的動態範圍,最後訓練歸壹化後的殘差序列。得到了均方誤差意義下的最佳量化器——勞埃德-馬克斯量化器。圖1訓練過程LP的偏傳遞函數為(1),其中α i (I = 1,...,P)是預測系數。濾波器輸出序列e(n)可近似視為服從拉普拉斯分布的白噪聲。方差估計的表達式為(2)。這是壹個單碼字記憶方差估計,壹般來說有部分估計。等式(2)右側的第壹項表示先前樣本方差估計對當前方差估計的貢獻。第二項表示前壹信號樣本對當前信號樣本的方差估計的貢獻。方差估計隨著輸入樣本值的變化而快速變化,因此可以跟蹤輸入信號的快速變化。所以,這是壹個瞬間的適應。由於殘差信號近似為拉普拉斯分布,且大部分樣本幅度值集中在零附近,為了加快訓練過程的收斂,可以設置壹個閾值幅度。當信號樣本幅度大於該閾值幅度時,使其等於閾值幅度。另外,信號幅度近似對稱分布,只能訓練正(或負)幅度。培訓流程請參考文獻[4]。1.2.在TCM中,為了在每個符號間隔中發送2m個符號中的壹個,傳統的2m個點的信號星座將被加倍(達到2m+1)。分成2+1個子集,其中正整數小於等於m,輸入比特用碼率為/(+1)的卷積碼擴頻,確定當前符號間隔內的信道符號取自哪個子集,剩余的(m-)比特用於從所選子集中的2m個信道符號中選擇壹個。假設信道中存在加性高斯白噪聲幹擾,采用維特比譯碼尋找並發送不同序列和最小概率的符號序列。對應於源編碼,給定壹個卷積碼,源序列可以看成壹個有噪聲的序列,用維特比算法可以找到最接近的序列。因此,從編碼調制公式及其對應的維特比算法編碼器中獲得的所有允許的信道序列集,都可以用作信源空間和對應的信源編碼器。在該模型中,編碼率是2比特/樣本,即m=2。采用(2,1)卷積碼,即=1。對應的量化器階數的總數是8,並且它被分成四個子集D0、D1、D2和D3。在坐標軸上,量值從左到右逐漸增大。這樣就把圖2的子集劃分成了圖2集合劃分,APTCQ編碼器的編碼算法如下。設待編碼的數據序列為X = {X1,X2,...,xn},編碼過程在第I步,結束於第k個節點(時間i-1)的路徑稱為生存路徑。J=1,2,…)是k上xi-j的近似值(編碼值),其中n是光柵狀態的數量。設ki | i-1表示當前數據的預測值,給定ki | i-j (j = 1,2,…)。設dki =(KI)2 =α(KI-1)2+β(KI-1)2。最後,設ρi-1(X,k)為k上的失真,在所有的Ungerboeck調幅網格中,有兩個分支,每個分支的子集名分別進入和離開每個節點。給妳。來確定最接近dki的元素,稱為kl。除了標量量化選擇的這個元素之外,子集中的其他元素都被丟棄。然後,下面的每個節點有兩個分支。當下壹個節點為L時,這兩個分支標記為k1l和k2l,其中k 1和k2是這兩個分支開始的節點。最後還有ρi(X,L) = mink ∈ {k1,k2} [ρ I-1 (x,k)+(dki-KL)2](3)Li = k′I | I-1+k′Lki(4)。第二個是符號序列,用於確定每個節點的選定子集中的壹個元素。這兩個序列被發送到接收端進行解碼。這種編碼形式提高了系統的抗噪聲性能。卷積碼的狀態轉換如圖3所示。圖3狀態轉移1.3解碼部分的框圖如圖4所示。解碼部分的工作原理是:首先用卷積碼對比特序列進行擴展。它用於確定量化器的符號空間中的相應子集,並且符號序列從所確定的子集中選擇適當的元素。然後,所確定的元素乘以它們的方差估計,並被發送到標準DPCM解碼器,以獲得重構的語音序列。DPCM解碼器的傳遞函數是v (z) = pi = 1α iz-i其中α i (i = 1,2,...,P)是訓練過程的預測系數。圖4譯碼器圖2實驗結果本文在微機上對上述APTCQ編譯碼算法進行了仿真。所用的數字語音序列由TMS320C25數字處理系統獲得。采樣速率為8 kHz。每個語音樣本由12比特線性表示。卷積碼的狀態轉換如圖3所示。自適應參數α = 0.85,β = 0.25。三階預測器的預測系數為α 1 =-1.74,α 2 = 1.22,α 3 = 0.32。0).采用PTCQ算法時,平均分段信噪比為10.41 dB,采用APCQ算法時,平均分段信噪比為14.91 dB。非正式試聽表明其主觀質量明顯提高。3結論在研究PTCQ算法的基礎上,對其進行了改進。結論如下:(1)自適應方差估計的引入不僅提高了整體處理效果,而且大大改善了小信號的質量。(2)仿真實驗表明,在相同碼率下,APTCQ算法重建的語音質量優於PTCQ算法。(3)由於編碼過程中采用了TCQ技術,系統的抗幹擾能力優於相應的DPCM系統。作者簡介:李泰傑(1974 ~),男,博士生。作者:李泰傑,胡廣瑞(上海交通大學電子工程系,上海200030)

記得領養

  • 上一篇:用C++實現編寫壹個程序。
  • 下一篇:2022考研347人工智能可以調劑什麽學校
  • copyright 2024編程學習大全網