當前位置:編程學習大全網 - 編程語言 - 什麽是DSP技術?

什麽是DSP技術?

數字信號處理(Digital Signal

Processing——DSP)強調的是通過專用集成電路芯片,利用數字信號處理理論,在芯片上運行目標程序,實現對信號的某種處理.

數位訊號處理(Digital Signal Processing)是二十壹世紀形成科學和工程最具威力的技術之壹。在各領域內廣泛的範圍中已經發生革命性的改變:通訊、醫療影像、雷達和聲納、高保真度(fidelity)音樂重制,和原油探勘,只有這些有被命名。每壹個領域的DSP技術都已發展到壹定的深度,有它們自個兒的演算法、數學和特定的技巧。結合廣度與深度使得任何人都不能精通所有已被發展的DSP技術。DSP教育包含二項工作:學習壹般可套用於整體的概念,以及對妳感興趣的特定領域學習專業的技巧。本章藉由描述DSP已在數個不同領域中造成的戲劇般效應來開啟我們進入數位訊號處理(Digital Signal Processing)世界的旅程。革命已經開始了。

DSP的起源(The Roots of DSP)

數位訊號處理不同於其它電腦科學中的領域是由於它使用的資料型別的唯壹性:訊號(signals)。在大多情況下,這些訊號起源於現實世界中知覺的(sensory)資料:地震的擺動(seismic vibrations)、視覺影像、聲波等……。在訊號已經被轉換為數位型式後,DSP是數學、演算法和用來處理這些訊號的技術。這包含廣泛、多變化的目標,例如:強化視覺影像,辨識和產生對話(語音),為了儲存和傳送的資料壓縮,等……。假設我們加壹個「對比到數位的轉換器」給電腦,並用它來擷取壹部份真實世界的資料。DSP回答了問題:下壹步是什麼?

DSP的起源是在1960和1970年代,當數位電腦首度變成可用時。電腦在這個時代是很昂貴的,而DSP受限於只有壹些關鍵性的應用。先鋒們主要努力於四個關鍵領域:冒著國際的安全性危險的雷達和聲納,可以賺大把鈔票的原油探勘,資料有不可取代性的太空探索和可以救命的醫學影像。1980和1990時個人電腦的革命使得DSP新的應用突然遽增。動機並非是由於軍事和政府的需求,DSP突然被商業市場驅動了。任何認為他們可以在快速擴大的領域中賺錢的人全都突然變成是DSP的廠商。DSP在這樣的產品中變成眾所皆知的了:行動電話,CD(compact disc players),和電子語音郵件。圖1-1列舉了這些應用中的壹部份。

此技術革命由上而下發生。在1980早期,DSP在電子電機領域中是在研究所課程中教授的課程。十年後,DSP已經變成大學標準課程的壹部份。今日,DSP變成在許多領域中被科學家和工程師需要的基本技巧。以此類推,DSP可以被和之前技術革命中的「電子學(electronics)」相比。雖然仍是電子電機領域,幾乎每個科學家和工程師都有些基礎電路設計的背景。沒有的話,他們可能會迷失在技術的世界中。DSP也有相同的未來。

圖1-1

DSP已經在科學與工程的許多領域中發動革命。壹些多樣化的應用列於此。

近來的歷史更是超令人好奇的;它對妳學習和使用DSP的能力上有極大的影響。假設妳遇到了壹個DSP問題,並且轉向教科書或其它出版品以尋求答案。妳通常找到的是壹頁又壹頁的方程式,難解的(obscure)數學符號和不熟悉的術語。這真是場惡夢!即使對那些在此領域中有經驗的人而言,許多DSP文獻仍令人困惑(baffling)。這並不是在文獻上有錯,它只是預期要給非常特定的讀者群。目前發展中之科技的研究者需要這種復雜(詳細)的數學以了解工作的理論的意涵(theoretical implications)。

本書基本的假設是大部份實用的DSP技術可以在沒有傳統復雜的數學和理論的藩籬下被學習和使用。《科學家和工程師的數位訊號處理指引手冊》(《The Scientist and Engineer’s Guide to Digital Signal Processing》)是為了那些想要使用DSP作為工具、而非新的職業的人寫的。

本章剩余的部份列舉了壹些DSP已經產生革命性變革的領域。當妳看過每個應用,註意到DSP是非常介於各學科間的(interdisciplinary),依賴於許多相鄰領域中的技術性工作。如圖1-2所建議的,介於DSP和其它技術學科間的邊界並不明顯也沒有完善的定義,而是模糊和重疊的。如果妳想要專攻DSP,妳也需要去研讀壹些相關的領域。

圖1-2

數位訊號處理在很多科學、工程和數學領域上有模糊和重疊的邊界。

電信(Telecommunications)

電信是關於從壹個位置傳送資訊給另壹個。這包含許多資訊的型式:電話交談、電視訊號、電腦檔案和其它類型的資料。要傳送資訊,妳需要壹個介於二個位置間的通道(channel)。這可能是壹對導線(wire pair),無線電廣播訊號,光纖,等……。電信公司接收傳送他們的客戶的資訊的付費款項,然而他們必須付費來建立和維護通道(channel)。財務上的帳本盈虧結算線(bottom line)很簡單:他們可以經由單壹通道來傳遞愈多的資訊,他們可以賺愈多的錢。DSP已經在許多領域中的電信產業發動革命:聲調(tone)訊號的產生及偵測,頻帶(frequency band)平移,為了移除電力線的嗡嗡聲(power line hum)的濾波動作(filtering),等等……。從電話網路中有三個特殊的例子在此會被討論:多路傳輸(multiplexing)、壓縮和回聲控制(echo control)。

多路傳輸(Multiplexing)

世界上大約有十億的電話。按下幾個鍵,交換網路允許在任何地方的任何人只要幾秒鐘就可以被連結起來。此項無限大(immensity)的任務讓人猶豫。直到1960時,介於二支電話間的連結需要經由機械的交換器和擴大器(amplifiers)來傳送類比聲音訊號。壹個連結需要壹對導線。比較起來,DSP將音訊轉換成序列數位資料串流。因為位元可以被輕易地編結(interwinded)並且稍後被分開,許多電話談話可以被在單壹通道(channel)上傳送。例如,電話的標準已知為T-carier system,它可以同時傳送24個聲音訊號。每個聲音訊號使用8 bit companded(對數壓縮,logarithmic compressed)類比對數位的轉換來每秒抽樣8000次。每個聲音訊號中的結果被表成64,000 bits/sec,且所有的24個channel都包含在1.544 megabits/sec內。使用傳統的22 gauge銅制電話線,訊號可被傳送約6000英呎,典型的互相連接的距離。數位傳輸在財務上的優點很多。電線和類比交換器很貴,數位邏輯閘(digital logic gates)很便宜。

壓縮(Compression)

當聲音訊號以8000 samples/sec被數位化,大部份的數位資訊會是多余的(redundant)。也就是說,由任何壹個樣本承載的資訊會被鄰近的樣本大量地復制。數以打計的DSP演算法已經被發展來轉換數位化的聲音訊號成需要較少bits/sec的資料串流。這些被稱作資料壓縮(data compression)演算法。相對應的解壓縮(uncompression)演算法則被用來回復訊號到它原本的型式。這些演算法在進行壓縮的數目和結果的聲音品質上變化。壹般而言,可將資料速率從64 kilobits/sec減少到32 kilobits/sec,而不損失聲音的品質。當壓縮成資料速率8 kilobits/sec時,聲音會明顯地被影響,不過仍然對長距離電話網路很有用。最長的可達到的壓縮約是2 kilobits/sec,導致高度扭曲的聲音,不過可用於壹些應用,例如軍隊和海底通訊。

回聲控制(Echo control)

回聲在長距離電話連結中是壹個嚴重的問題。當妳對電話說話時,壹個代表妳的聲音的訊號傳導(travel)到連接的接收器上,其中部份的訊號會回傳,即為回聲(echo)。如果連結在數百英哩之內,用來接收回聲所花費的時間僅有幾毫秒(milliseconds)。人耳習慣於聽這些小的時間延遲的回聲,而連結似乎相當正常。當距離變得較長,回聲變得越來越顯著且惱人(irritating)。對於州際間的通訊,延遲可以是數百微秒,而且特別令人不愉快(objectionable)。數位訊號處理藉由量測傳回的訊號並產生適當的反訊號(antisignal)以消除煩擾的回聲,來著手處理此類的問題。同樣的技術讓喇叭擴音器使用者可以同時聽和說而沒有抗爭的(fighting)音訊回饋(長而尖的聲音, squealing)。它也可藉由數位產生的反噪音(anitnoise)來抵消它,以減少環境噪音。

音訊處理(Audio Processing)

人類的二大主要感官是視覺和聽覺。相對應地,許多DSP與影像及音訊處理相關。人們聽音樂和語言(語音)。DSP已經在這二大領域上有革命性的變化。

音樂(Music)

從音樂家的麥克風到愛玩高級音響的人的揚聲器的路徑是相當長的。數位資料表示法很重要,因為它會防止「壹般和類比式儲存和處理相關」的降級。這對任何比較過卡帶和CD的音樂品質的人來講會很熟悉。在壹般的情境(scenario)中音樂片段在錄音室(sound studio)中被錄起來在數個頻道或音軌(track)上。在某些情況下,這甚至包含各別錄制單獨的樂器和歌手。這麼做是為了給予聲音工程師在制作最後的成品時較大的彈性。組合各別的音軌到最後的成品的復雜過程被稱作mix down。DSP可以在mix down時,提供數種重要的功能,包括了:濾聲(filtering),訊號加和減,訊號編輯,等……。

譯註:把 X 聲道的 audio 混成 Y 聲道,其中 X 是大於 Y 的數字,例如說妳的 DVD 上面是 5.1 聲道,但是妳只有耳機,耳機只有雙聲道,所以就需要 mix down 成 2 channel,感謝Jedi提供解釋。

最有趣的DSP在音樂準備上的應用之壹是人工余韻(artificial reverberation)。如果各別的頻道被簡單地加在壹起,結果的片段聽起來渺茫無力(frail and diluted),很像是音樂家在戶外演奏。這是因為聽者被音樂的回音或余韻的內容大大地影響了,而通常在錄音室內這些都被最小化了。DSP允許人造回聲和余韻在mix down時被加總以模擬各種理想的聆聽環境。有數百微秒延遲的回聲給予人像教堂般地點的印象。增加10-20微秒延遲的回聲讓人感覺在更適當大小的聆聽空間。

語音的產生(Speech generation)

語音的產生和辨識被用來作為人與機器間的溝通。並不是用妳的手和眼,而是用妳的嘴和耳。當妳的手和眼應該做些別的事,例如:開車,開刀,或(不幸地)用武器對敵人開火時,這非常方便。對於電腦所產生的語音,會使用二個方法:數位錄音和聲道模擬(vocal tract simulation)。在數位錄音中,人聲被數位化並儲存,通常在壹種壓縮表格(compressed form)裏。在錄放時,儲存的資料被解壓縮並且被轉回到類比訊號。整整壹小時錄下來的語音只需要大約3 megabytes來儲存,甚至在小電腦系統裏也能。這是今日使用的、最常見的數位語音產生的方法。

聲道模擬(vocal tract simulation)更復雜,藉由人類建立語音的方法來試著模仿身體的(physical)機制。人類聲道模擬是由室內(chamber)的尺寸和形狀決定的具***鳴頻率(resonant frequency)的聲腔(acoustic cavity)。在比較上,摩擦音源於在狹窄的壓縮下嘈雜的空氣雜訊,就好像牙齒和嘴唇。聲道模擬藉由產生模仿這二種刺激(excitation)的數位訊號來運作。***鳴室(resonate chamber)的特性是經由具相似***振的數位濾波器來傳送刺激訊號來模擬。此方法被用於非常早期的DSP成功故事的其中壹個,Speak & Spell是賣得很好的、給兒童的電子輔助學習器。

語音辨識(Speech recognition)

自動地人類語音辨識比產生語音更加地困難。語音辨識是人腦做的好,但數位電腦做的很差的經典範例。數位電腦可以儲存並且記得非常大量的資料,以極快的速度執行數學計算,並且做重覆的工作而不會厭煩或沒有效率。不幸地,當面對未加工的感知資料(raw sensory data)時,今日的電腦執行地非常差。教導電腦每月寄給妳帳單很容易。教導同壹臺電腦去了解妳的聲音是件大工程。

數位訊號處理壹般在二個步驟中處理語音辨識問題:在特色配對(feature matching)之後做特色擷取(feature extraction)。

進入的音訊訊號中的每個字要先被隔離,然後分析以辨識刺激和***振頻率的類型。然後這些參數與之前說話的字的範例做比較以辨識出最接近的配對。常常,這些系統受限於只有幾百字,只能接受字與字間有可分辨的中斷的語音;且每個說話者需被個別再訓練。雖然這對許多商業應用是適當的,當與人類的聽力比較時,這些限制是簡陋的(humbling)。在此領域有很多工作要被完成,成功的商業性產品的那些人會有巨大的金錢上的獎賞。

回聲位置(Echo Location)

獲得關於遠端物件資訊的常見方法是彈出壹個離開它的波(bounce a wave off of it)。例如,雷達藉由傳送無線電波的脈沖波,並且對每個從飛機回聲檢查接收到的訊號來運作。在聲納上,聲波經由水傳送以偵測潛水艇和其它水面下的物體。地球物理學家已經藉由設定長期爆破並聽取從巖石的深埋層(deeply buried layers of rock)的回聲來針測地球。雖然這些應用有***同的思路(thread),它們每個都有自個兒特定的問題和需求。數位訊號處理已經在三個領域中都已產生了革命性的變化。

雷達(Radar)

雷達(Radar)是 RAdio Detection And Ranging的首字縮寫。在最簡單的雷達系統裏,無線電傳送器產生壹個好幾微秒長的無線電頻率能量脈沖。此脈沖被餵進高度的指向天線(directional antenna),在那裏導致無線電波傳播(propagate)並以光速離開。在此波路徑上的飛機會反射回來壹小部份的能量到位於傳送站附近的接收天線。到物體的距離由介於被傳送的脈沖和接收的回聲間花費的時間來計算。物體的方向更容易發現,當回聲被接收時,妳知道妳在哪裏指到指向天線(directional antenna)。

雷達系統的運作範圍由二個參數決定:初始脈沖內有多少能量,及無線電接收器的噪音水準。不幸地,要在脈沖波裏增加能量通常需要更長的脈沖波。接著,較長的脈沖波減少正確性和消耗時間測度的精度。這導致了二個重要參數間的沖突:偵測遠距離物體的能力,和正確地決定物體的距離的能力。

DSP在三個領域有革命性的雷達,它們全都與基本問題相關。第壹個,DSP可以在脈沖波被接收後壓縮它,提供較佳距離測定而不需減小其作業範圍。第二個,DSP可以過濾掉所接收的訊號來減少雜訊。這增加了範圍,而不用將距離測定降級。第三,DSP能夠快速選取並產生不同脈沖波形和長度。除了其它的(問題)外,這讓脈沖波對特定的偵測問題被最佳化。現在是令人印象深刻的部份:這裏面很多是由和所使用的無線電頻率差不多的抽樣率(sampling rate),約是數百megahertz!當它涉及雷達這方面時,DSP與高速硬體設計高度相關就和它與演算法的關系壹樣。

聲納(Sonar)

聲納是SOund NAvigation and Ranging的首字縮寫。它被分成二大類,主動式(active)和被動式(passive)。在主動式聲納中,介於2 kHz 和40 kHz 間的聲音脈沖波被傳送到水裏,而結果的回聲被偵測和分析。使用主動式聲納包含:偵測和定位水面下的物體、航海、通訊和映射(mapping)到海底(sea floor)。壹般最大操作範圍是10到100公裏。與其相比,被動式聲納只聆聽海面下的聲音,包含:自然的亂流(turbulence)、海洋生物和從潛艇和表面船艦發出的機械聲。因為被動式聲納沒有消除能量,它對於轉換作業而言很理想。妳想要偵測其它人(the other guy),而不要他偵測妳。被動式聲納最重要的應用是軍事監視(surveillance)系統,它偵測並追蹤潛水艇。被動式聲納壹般使用比主動式聲納較低的頻率,因為它們經由水以較少的吸收作用被傳播(propagate)。偵測範圍可達到數千公裏。

DSP在聲納方面已經與雷達方面有許多相同的領域都有革命性的發展:脈沖波的產生、脈沖波壓縮和過濾偵測到的訊號。有個聲納比雷達簡單的觀點:因為包含了較低的頻率。另壹個觀點是,聲納比雷達更難,因為環境較不壹致也較不穩定。聲納系統通常使用昂貴的陣列來傳送和接收元素,而不是只有單壹個頻道。藉由適當地控制和混合這許多元素的訊號,聲納系統可以指引被消除的脈沖波到想要的位置並且決定回音被接收的方向。要處理這許多的頻道,聲納系統需要與雷達同樣大規模的DSP運算能力。

反射地震學(Reflection seismology )

大約是1920年代早期,地球物理學家發現地球外殼的結構可以用聲音來探測。探勘者可以引爆並從在表面下超過十公裏的邊界層(boundary layer)紀錄回聲。這些回聲震動圖(seismograms)由肉眼解讀來對應到次表面(subsurface)的結構。反射地震法(reflection seismic method)很快地變成主要確定石油和礦藏位置的方法,且直到今日仍是。

在理想的情況下,傳送到地面的聲音脈沖波從每個脈沖波經過的邊界層產生壹個回聲。不幸地,情況通常不會這麼簡單。每壹個傳回到地表的回聲必須經過所有其它上面(它源自的)邊界層。這會導致回聲在層與層之間跳躍,產生回聲的回聲在表面被偵測到。這些次要的回聲可以使被偵測的訊號非常地復雜和難以解讀。自從1960年代,數位訊號處理已經被廣泛地運用來從反射震動圖(reflection seismograms)中的次要回聲隔離主要的回聲。早期的地球物理學家如何在沒有DSP的情況下處理?答案很簡單:他們看簡單的地方,在那裏多重反射被最小化。DSP允許原油在困難的位置被發現,例如在海的下方。

影像處理(Image Processing)

影像是具有特性的訊號。首先,它們是空間(距離)上參數的測度,雖然大部份訊號是時間參數的測度。第二,它們包含很多資訊。例如,可能需要超過10 megabytes來儲存二分之壹的電視錄影。這比壹個相似長度的聲音訊號大了超過1000倍。第三,最終品質的判斷通當會受限於人類的評估,而非客觀存在的評斷標準。這些特性已經使得影像處理變成DSP內不同的子群組。

醫療的(Medical)

在1895年,Wilhelm Conrad R?ntgen發現了X光可穿透相當數量的實際物體。醫學藉由可以看到活生生的人體內而有了革命性的進步。醫療用X光系統只在幾年內便散布全球。盡管它明顯的成功,直到DSP及相關技術在1970年出現之前,醫療用X光影像壹直受限於四個問題。笫壹,人體內重疊的結構可以藏在另壹個之後。例如,在肋骨後方的部份心藏可能無法被看見第二,並不總是能區分相似的組織(tissue)。例如,可能可以從軟組織分開骨頭,不過不能從肝藏分辨腫瘤。第三,X光影像顯示解剖結構(anatomy),身體的結構,而不是生理學,身體的運作。活人的X光影像看起來就像是死人的X光影像!第四,曝露在X光下會引起癌癥,需要謹慎地(sparingly)且只能在有適當的理由時才能使用它。

重疊結構的問題在1971年引入第壹臺計算式斷層攝影法(computed tomography)掃描器被解決了(正式地名稱是computed axial tomography或CAT 掃描器)。計算式斷層攝影法(CT)是壹經典的數位訊號處理的例子。從許多方向的X光會穿透病人被檢查時的身體各部份(section)。並非簡單地以偵測到的X光形成影像,而是訊號被轉成數位資料並儲存在電腦中。然後此資訊被用於計算要顯示為身體各切片(slice)的影像。這些影像比傳統的技術顯示更多的細節,允許值得註目地更好的檢測和治療。CT的影響幾乎和原本引入X光影像本身壹樣大。在幾年之內,世界上的每家大醫院都已經使用CT掃描器了。在1979年時, CT原理的貢獻者中其中的二位,Godfrey N. Hounsfield 和 Allan M. Cormack,***享了諾貝爾醫學獎(Nobel Prize in Medicine)。那是好DSP!

最後的三個X光問題已經藉由使用不是X光的穿透性能源(penetrating energy)被解決了,例如無線電和聲波。DSP在所有這些技術中扮演壹個關鍵的角色。例如,核磁***振影像(Magnetic Resonance Imaging,MRI)使用磁場連結無線電波來探測人體的內部。適當地調整磁場強度和頻率讓在身體區域範圍內的原子核可以介於量子能源狀態間***振。此***振導致次要的無線電波放射,由放在靠近身體的天線偵測。這個偵測到的訊號的強度和其它特性提供了關於***振局部區域的資訊。磁場的調整讓被經此身體掃描的***振區域對應到內部的結構。此資訊通常被表示成影像,就像是計算式斷層攝影般。除了提供介於不同類型軟組織間傑出的辨識外,MRI可以提供關於生理學(physiology)的資訊,例如經由動脈的血液流。MRI完全依賴數位訊號處理技術,沒有它們無法被實作。

外太空(Space)

有時候,妳只是必須把壹張爛相片弄到最好。這情況屢次都是因為影像從無人管理的衛星和太空探索火箭拍的。沒有人會送壹個修理工到火星只是去扭轉像機的旋鈕!DSP可以用數種方法來增進在非常不適宜的情況下所拍的影像的品質,它們是:亮度和對比調整,邊界偵測,雜訊減少,焦點調整,動作模糊減少,等……。有空間扭曲的影像,例如拍攝球面星球的平面影像所遇到的,可以被變形(warped)成壹種正確的表示法。許多各別的影像可以被結合成單壹的資料庫,讓資訊以唯壹的方式被顯示。例如,壹個電視影像序列模擬飛機在不同星球的表面飛行。

商業化的影像產品(Commercial Imaging Products)

對於在大量出售給大眾的系統而言,在影像內大量的資訊內容是個問題。商業化的系統必須要便宜,且這不是大量記憶體和高度資料傳輸速率配合的結果。壹個對此定理的解答是影像壓縮(image compression)。就好像聲音訊號,影像包含極大數目的多余資訊,且可經由減少「需要用來表示的bits數目」的演算法來回傳。電視和其它動作片尤其適合壓縮,因為大部份的影像從壹個frame到另壹個frame仍舊是壹樣的。商業化的影像處理軟體利用此技術,包含了:視訊電話、顯示移動中圖片的電腦程式和數位電視。

  • 上一篇:壹笑奈何是什麽職業?
  • 下一篇:北京java培訓分享關於控制語句的使用方式
  • copyright 2024編程學習大全網