當前位置:編程學習大全網 - 源碼破解 - 什麽是音頻

什麽是音頻

音頻定義

1.Audio,指人說話的聲音頻率,通常指300Hz-3400Hz的頻帶。

2.指存儲聲音內容的文件。

3.在某些方面能指作為波濾的振動。

音頻這個專業術語,人類能夠聽到的所有聲音都稱之為音頻,它可能包括噪音、 聲音被錄制下來以後,無論是說話聲、歌聲、樂器都可以通過數字音樂軟件處理。把它制作成CD,這時候所有的聲音沒有改變,因為CD本來就是音頻文件的壹種類型。而音頻只是儲存在計算機裏的聲音。 演講和音樂,如果有計算機加上相應的音頻卡 -- 就是我們經常說的聲卡,我們可以把所有的聲音錄制下來,聲音的聲學特性,音的高低都可以用計算機硬盤文件的方式儲存下來。反過來,我們也可以把儲存下來的音頻文件通過壹定的音頻程序播放,還原以前錄下的聲音。

解讀音頻屬性

大家都承認現在是壹個數碼時代,為了追求優良的音質很多人不懈地努力。隨著數碼時代的來臨,誰都承認數碼音頻比模擬信號優越。什麽是模擬信號?其實任何我們可以聽見的聲音經過音頻線或話筒的傳輸都是壹系列的模擬信號。模擬信號是我們可以聽見的。而數字信號就是用壹堆數字記號來記錄聲音,而不是用物理手段來保存信號。(用普通磁帶錄音就是壹種物理方式)數字信號我們實際上是聽不到的。

這樣我們可以簡略地比較壹下模擬時代的錄音制作與數碼時代的區別:模擬時代是把原始信號以物理方式錄制到磁帶上(當然在錄音棚裏完成了),然後加工,剪接,修改,最後錄制到磁帶,LP等廣大聽眾可以欣賞的載體上。這壹系列過程全是模擬的,每壹步都要損失壹些信號,到了聽眾手裏自然是差了好遠,更不用說什麽HI-FI了。數碼時代是第壹步就把原始信號錄成數碼音頻資料,然後用硬件或軟件進行加工處理,這個過程相比模擬方法有無比的優越性,因為它幾乎不會有任何損耗。對於機器來說只是處理壹下數字而已,當然丟碼的可能性也有,但只要操作合理就不會發生。最後把這堆數字信號傳輸給數字記錄設備如CD等,損耗自然小很多了!

如果我們註意壹下身邊的CD片就會看到很多CD都有如:ADD,AAD,DDD等標記。三個字母各代表該片在錄音,編輯,成品三個過程中所使用的方法是模擬(Analog)的還是數字(Digital)的。當然A代表模擬,D代表數字。AAD就說明其錄音和編輯是用模擬方式的,而最後灌片是用數字方式的,這類唱片多是將過去錄制的音樂轉成CD片而不做任何修改。ADD則是有壹個修改過程,許多古典音樂大師的演奏或指揮多錄制於模擬時代,我們現在聽到的CD是經過修改後罐錄的,很多這類唱片都有標記ADD。而DDD的唱片必然是較現代的錄音品。自然,CD片必然以D結尾,而磁帶可以姑且認為是AAA,雖然好象並沒有這種說法。

所以說,數碼音頻是我們保存聲音信號,傳輸聲音信號的壹種方式,它的特點是信號不容易損失。而模擬信號是我們最後可以聽到的東西。不過模擬信號的修改簡直是壹場災難,損失太大了。有此僻好的格倫?古爾德若活到現在也會瞠目結舌的。而數碼音頻復制100遍也不會有損耗,不信大家COPY壹個WAVE文件試試?

數碼錄音最關鍵壹步就是要把模擬信號轉換為數碼信號。就電腦而言是把模擬聲音信號錄制成為Wave文件,這個工作Windows自帶的錄音機也可以做到,但是它的功能十分有限,不能滿足我們的需求,所以我們用其他專業音頻軟件代替,如Sound Forge等。錄制出來的文件就是Wave文件,描述Wave文件主要有兩個指標,壹個是采樣精度,另壹個是比特率。這是數字音頻制作中十分重要的兩個概念,下面就來看壹下吧。

什麽是采樣精度?因為Wave是數碼信號,它是用壹堆數字來描述原來的模擬信號,所以它要對原來的模擬信號進行分析,我們知道所有的聲音都有其波形,數碼信號就是在原有的模擬信號波形上每隔壹段時間進行壹次“取點”,賦予每壹個點以壹個數值,這就是“采樣”,然後把所有的“點”連起來就可以描述模擬信號了,很明顯,在壹定時間內取的點越多,描述出來的波形就越精確,這個尺度我們就稱為“采樣精度”。我們最常用的采樣精度是44.1kHz/s。它的意思是每秒取樣44100次,之所以使用這個數值是因為經過了反復實驗,人們發現這個采樣精度最合適,低於這個值就會有較明顯的損失,而高於這個值人的耳朵已經很難分辨,而且增大了數字音頻所占用的空間。壹般為了達到“萬分精確”,我們還會使用48k甚至96k的采樣精度,實際上,96k采樣精度和44.1k采樣精度的區別絕對不會象44.1k和22k那樣區別如此之大,我們所使用的CD的采樣標準就是44.1k,目前44.1k還是壹個最通行的標準,有些人認為96k將是未來錄音界的趨勢。采樣精度提高應該是壹件好事,可有時我也想,我們真的能聽出96k采樣精度制作的音樂與44.1k采樣精度制作的音樂的區別嗎?普通老百姓家裏的音響能放出他們的區別嗎?

比特率是大家常聽說的壹個名詞,數碼錄音壹般使用16比特,20比特,24比特制作音樂,什麽是“比特”?我們知道聲音有輕有響,影響輕響的物理要素是振幅,作為數碼錄音,必須也要能精確表示樂曲的輕響,所以壹定要對波形的振幅有壹個精確的描述,“比特”就是這樣壹個單位,16比特就是指把波形的振幅劃為216即65536個等級,根據模擬信號的輕響把它劃分到某個等級中去,就可以用數字來表示了。和采樣精度壹樣,比特率越高,越能細致地反映樂曲的輕響變化。20比特就可以產生1048576個等級,表現交響樂這類動態十分大的音樂已經沒有什麽問題了。剛才提到了壹個名詞“動態”,它其實指的是壹首樂曲最響和最輕的對比能達到多少,我們也常說“動態範圍”,單位是dB,而動態範圍和我們錄音時采用的比特率是緊密結合在壹起的,如果我們使用了壹個很低的比特率,那麽我們就只有很少的等級可以用來描述音響的強弱,我們當然就不能聽到大幅度的強弱對比了。動態範圍和比特率的關系是;比特率每增加1比特,動態範圍就增加6dB。所以假如我們使用1比特錄音,那麽我們的動態範圍就只有6dB,這樣的音樂是不可能聽的。16比特時,動態範圍是96dB。這可以滿足壹般的需求了。20比特時,動態範圍是120dB,對比再強烈的交響樂都可以應付自如了,表現音樂的強弱是綽綽有余了。發燒級的錄音師還使用24比特,但是和采樣精度壹樣,它不會比20比特有很明顯的變化,理論上24比特可以做到144 dB的動態範圍,但實際上是很難達到的,因為任何設備都不可避免會產生噪音,至少在現階段24比特很難達到其預期效果。

音頻格式

以下是常見音頻文件格式的特點。

要在計算機內播放或是處理音頻文件,也就是要對聲音文件進行數、模轉換,這個過程同樣由采樣和量化構成,人耳所能聽到的聲音,最低的頻率是從20Hz起壹直到最高頻率20KHZ,20KHz以上人耳是聽不到的,因此音頻的最大帶寬是20KHZ,故而采樣速率需要介於40~50KHZ之間,而且對每個樣本需要更多的量化比特數。音頻數字化的標準是每個樣本16位-96dB的信噪比,采用線性脈沖編碼調制PCM,每壹量化步長都具有相等的長度。在音頻文件的制作中,正是采用這壹標準。

CD格式:天簌

當今世界上音質最好的音頻格式是什麽?當然是CD了。因此要講音頻格式,CD自然是打頭陣的先鋒。在大多數播放軟件的“打開文件類型”中,都可以看到*.cda格式,這就是CD音軌了。標準CD格式也就是44.1K的采樣頻率,速率88K/秒,16位量化位數,因為CD音軌可以說是近似無損的,因此它的聲音基本上是忠於原聲的,因此如果妳如果是壹個音響發燒友的話,CD是妳的首選。它會讓妳感受到天籟之音。CD光盤可以在CD唱機中播放,也能用電腦裏的各種播放軟件來重放。壹個CD音頻文件是壹個*.cda文件,這只是壹個索引信息,並不是真正的包含聲音信息,所以不論CD音樂的長短,在電腦上看到的“*.cda文件”都是44字節長。註意:不能直接的復制CD格式的*.cda文件到硬盤上播放,需要使用象EAC這樣的抓音軌軟件把CD格式的文件轉換成WAV,這個轉換過程如果光盤驅動器質量過關而且EAC的參數設置得當的話,可以說是基本上無損抓音頻。推薦大家使用這種方法。

WAV:無損

是微軟公司開發的壹種聲音文件格式,它符合 PIFFResource Interchange File Format 文件規範,用於保存WINDOWS平臺的音頻信息資源,被WINDOWS平臺及其應用程序所支持。“*.WAV”格式支持MSADPCM、CCITT A LAW等多種壓縮算法,支持多種音頻位數、采樣頻率和聲道,標準格式的WAV文件和CD格式壹樣,也是44.1K的采樣頻率,速率88K/秒,16位量化位數,看到了吧,WAV格式的聲音文件質量和CD相差無幾,也是目前PC機上廣為流行的聲音文件格式,幾乎所有的音頻編輯軟件都“認識”WAV格式。

這裏順便提壹下由蘋果公司開發的AIFF(Audio Interchange File Format)格式和為UNIX系統開發的AU格式,它們都和和WAV非常相像,在大多數的音頻編輯軟件中也都支持它們這幾種常見的音樂格式。

MP3:流行

MP3格式誕生於八十年代的德國,所謂的MP3也就是指的是MPEG標準中的音頻部分,也就是MPEG音頻層。根據壓縮質量和編碼處理的不同分為3層,分別對應“*.mp1"/“*.mp2”/“*.mp3”這3種聲音文件。需要提醒大家註意的地方是:MPEG音頻文件的壓縮是壹種有損壓縮,MPEG3音頻編碼具有10:1~12:1的高壓縮率,同時基本保持低音頻部分不失真,但是犧牲了聲音文件中12KHz到16KHz高音頻這部分的質量來換取文件的尺寸,相同長度的音樂文件,用*.mp3格式來儲存,壹般只有*.wav文件的1/10,而音質要次於CD格式或WAV格式的聲音文件。由於其文件尺寸小,音質好;所以在它問世之初還沒有什麽別的音頻格式可以與之匹敵,因而為*.mp3格式的發展提供了良好的條件。直到現在,這種格式還是風靡壹時,作為主流音頻格式的地位難以被撼動。但是樹大招風,MP3音樂的版權問題也壹直是找不到辦法解決,因為MP3沒有版權保護技術,說白了也就是誰都可以用。

MP3格式壓縮音樂的采樣頻率有很多種,可以用64Kbps或更低的采樣頻率節省空間,也可以用320Kbps的標準達到極高的音質。我們用裝有Fraunhofer IIS Mpeg Lyaer3的 MP3編碼器(現在效果最好的編碼器)MusicMatch Jukebox 6.0在128Kbps的頻率下編碼壹首3分鐘的歌曲,得到2.82MB的MP3文件。采用缺省的CBR(固定采樣頻率)技術可以以固定的頻率采樣壹首歌曲,而VBR(可變采樣頻率)則可以在音樂“忙”的時候加大采樣的頻率獲取更高的音質,不過產生的MP3文件可能在某些播放器上無法播放。我們把VBR的級別設定成為與前面的CBR文件的音質基本壹樣,生成的VBR MP3文件為2.9MB。

MIDI:作曲家最愛

經常玩音樂的人應該常聽到MIDI(Musical Instrument Digital Interface)這個詞,MIDI允許數字合成器和其他設備交換數據。MID文件格式由MIDI繼承而來。MID文件並不是壹段錄制好的聲音,而是記錄聲音的信息,然後在告訴聲卡如何再現音樂的壹組指令。這樣壹個MIDI文件每存1分鐘的音樂只用大約5~10KB。今天,MID文件主要用於原始樂器作品,流行歌曲的業余表演,遊戲音軌以及電子賀卡等。*.mid文件重放的效果完全依賴聲卡的檔次。*.mid格式的最大用處是在電腦作曲領域。*.mid文件可以用作曲軟件寫出,也可以通過聲卡的MIDI口把外接音序器演奏的樂曲輸入電腦裏,制成*.mid文件。

WMA:最具實力

WMA (Windows Media Audio) 格式是來自於微軟的重量級選手,後臺強硬,音質要強於MP3格式,更遠勝於RA格式,它和日本YAMAHA公司開發的VQF格式壹樣,是以減少數據流量但保持音質的方法來達到比MP3壓縮率更高的目的,WMA的壓縮率壹般都可以達到1:18左右,WMA的另壹個優點是內容提供商可以通過DRM(Digital Rights Management)方案如Windows Media Rights Manager 7加入防拷貝保護。這種內置了版權保護技術可以限制播放時間和播放次數甚至於播放的機器等等,這對被盜版攪得焦頭亂額的音樂公司來說可是壹個福音,另外WMA還支持音頻流(Stream)技術,適合在網絡上在線播放,作為微軟搶占網絡音樂的開路先鋒可以說是技術領先、風頭強勁,更方便的是不用象MP3那樣需要安裝額外的播放器,而Windows操作系統和Windows Media Player的無縫捆綁讓妳只要安裝了windows操作系統就可以直接播放WMA音樂,新版本的Windows Media Player7.0更是增加了直接把CD光盤轉換為WMA聲音格式的功能,在新出品的操作系統Windows XP中,WMA是默認的編碼格式,大家知道Netscape的遭遇,現在“狼”又來了。WMA這種格式在錄制時可以對音質進行調節。同壹格式,音質好的可與CD媲美,壓縮率較高的可用於網絡廣播。雖然現在網絡上還不是很流行,但是在微軟的大規模推廣下已經是得到了越來越多站點的承認和大力支持,在網絡音樂領域中直逼*.mp3,在網絡廣播方面,也正在瓜分Real打下的天下。因此,幾乎所有的音頻格式都感受到了WMA格式的壓力。

RealAudio:流動旋律

RealAudio主要適用於在網絡上的在線音樂欣賞,現在大多數的用戶仍然在使用56Kbps或更低速率的Modem,所以典型的回放並非最好的音質。有的下載站點會提示妳根據妳的Modem速率選擇最佳的Real文件。現在real的的文件格式主要有這麽幾種:有RA(RealAudio)、RM(RealMedia,RealAudio G2)、RMX(RealAudio Secured),還有更多。這些格式的特點是可以隨網絡帶寬的不同而改變聲音的質量,在保證大多數人聽到流暢聲音的前提下,令帶寬較富裕的聽眾獲得較好的音質。

近來隨著網絡帶寬的普遍改善,Real公司正推出用於網絡廣播的、達到CD音質的格式。如果妳的RealPlayer軟件不能處理這種格式,它就會提醒妳下載壹個免費的升級包。許多音樂網站如 提供了歌曲的Real格式的試聽版本。現在最新的版本是RealPlayer 9.0。

VQF:無人問津

雅馬哈公司另壹種格式是*.vqf,它的核心是減少數據流量但保持音質的方法來達到更高的壓縮比,可以說技術上也是很先進的,但是由於宣傳不力,這種格式難有用武之地。*.vqf可以用雅馬哈的播放器播放。同時雅馬哈也提供從*.wav文件轉換到*.vqf文件的軟件。 此文件缺少特點外加缺乏宣傳,現在幾乎已經宣布死刑了。

OGG:新生代音頻格式

ogg格式完全開源,完全免費, 和mp3不相上下的新格式。

前途無量

時下的MP3支持格式最常見的是MP3和WMA。MP3由於是有損壓縮,因此講求采樣率,壹般是44.1KHZ。另外,還有比特率,即數據流,壹般為8---320KBPS。在MP3編碼時,還看看它是否支持可變比特率(VBR),現在出的MP3機大部分都支持,這樣可以減小有效文件的體積。WMA則是微軟力推的壹種音頻格式,相對來說要比MP3體積更小。

音頻處理

壹、音頻媒體的數字化處理

隨著計算機技術的發展,特別是海量存儲設備和大容量內存在PC機上的實現,對音頻媒體進行數字化處理便成為可能。數字化處理的核心是對音頻信息的采樣,通過對采集到的樣本進行加工,達成各種效果,這是音頻媒體數字化處理的基本含義。

二、音頻媒體的基本處理

基本的音頻數字化處理包括以下幾種:

不同采樣率、頻率、通道數之間的變換和轉換。其中變換只是簡單地將其視為另壹種格式,而轉換通過重采樣來進行,其中還可以根據需要采用插值算法以補償失真。

針對音頻數據本身進行的各種變換,如淡入、淡出、音量調節等。

通過數字濾波算法進行的變換,如高通、低通濾波器。

三、音頻媒體的三維化處理

長期以來,計算機的研究者們壹直低估了聲音對人類在信息處理中的作用。當虛擬技術不斷發展之時,人們就不再滿足單調平面的聲音,而更催向於具有空間感的三維聲音效果。聽覺通道可以與視覺通道同時工作,所以聲音的三維化處理不僅可以表達出聲音的空間信息,而且與視覺信息的多通道的結合可以創造出極為逼真的虛擬空間,這在未來的多媒體系統中是極為重要的。這也是在媒體處理方面的重要措施。

人類感知聲源的位置的最基本的理論是雙工理論,這種理論基於兩種因素:兩耳間聲音的到達時間差和兩耳間聲音的強度差。時間差是由於距離的原因造成,當聲音從正面傳來,距離相等,所以沒有時間差,但若偏右三度則到達右耳的時間就要比左耳約少三十微秒,而正是這三十微秒,使得我們辨別出了聲源的位置。強度差是由於信號的衰減造成,信號的衰減是因為距離而自然產生的,或是因為人的頭部遮擋,使聲音衰減,產生了強度的差別,使得靠近聲源壹側的耳朵聽到的聲音強度要大於另壹耳。

基於雙工理論,同樣地,只要把壹個普通的雙聲道音頻在兩個聲道之間進行相互混合,便可以使普通雙聲道聲音聽起來具有三維音場的效果。這涉及到以下有關音場的兩個概念:音場的寬度和深度。

音場的寬度利用時間差的原理完成,由於現在是對普通立體聲音頻進行擴展,所以音源的位置始終在音場的中間不變,這樣就簡化了我們的工作。要處理的就只有把兩個聲道的聲音進行適當的延時和強度減弱後相互混合。由於這樣的擴展是有局限性的,即延時不能太長,否則就會變為回音。

音場的深度利用強度差的原理完成,具體的表現形式是回聲.音場越深,則回音的延時就越長.所以在回音的設置中應至少提供三個參數:回音的衰減率、回音的深度和回音之間的延時。同時,還應該提供用於設置另壹通道混進來的聲音深度的多少的選項。

  • 上一篇:求合金彈頭7圖文攻略..
  • 下一篇:CPU的頻率越高越好嗎?
  • copyright 2024編程學習大全網