一区国严二区亚洲三区,WWW国产亚洲精品久久麻豆,亚洲日韩久久综合中文字幕

Technorati 標(biāo)簽: mp3,bit ratio

摘自：http://digi.maddiy.com/mp3/diy/2007-05-22/2600.html

數(shù)字音頻格式即以數(shù)字形式進(jìn)行記錄、處理和播放的音頻信號(hào)。數(shù)字音頻格式的出現(xiàn)，是為了滿足高保真復(fù)制、存儲(chǔ)、傳輸?shù)男枨蟆：?jiǎn)單的說(shuō)，早期的模擬音頻格式，存在著復(fù)制失真和因?yàn)榻橘|(zhì)磨損而失效的問(wèn)題。從CD盤的問(wèn)世開(kāi)始，數(shù)字格式音頻文件開(kāi)始普及，但又產(chǎn)生了一個(gè)問(wèn)題——存儲(chǔ)體積上的限制，同時(shí)CD盤仍然存在磨損的現(xiàn)象。如果保存到硬盤上（相對(duì)存儲(chǔ)時(shí)間更長(zhǎng)），在當(dāng)時(shí)存儲(chǔ)介質(zhì)（主要是硬盤）仍然昂貴的情況下，也不是好的解決方法。而互聯(lián)網(wǎng)的出現(xiàn)，更產(chǎn)生了遠(yuǎn)距離傳輸文件的要求，在帶寬的制約下，縮小文件體積的需求變得更加強(qiáng)烈，這些都從外部因素上導(dǎo)致了有損壓縮數(shù)字音頻格式產(chǎn)生！

而從內(nèi)部因素來(lái)說(shuō)，隨著電腦運(yùn)算、編碼能力的提高，各種聲學(xué)心理模式的進(jìn)步，促進(jìn)了各種有損壓縮數(shù)字音頻格式的層出不窮。以下簡(jiǎn)要介紹一些在MP3隨身聽(tīng)上廣泛使用的音頻格式——MP3（CBR、VBR、ABR）、WMA、WAV、ADPCM，以及新興的音頻格式AAC、ASF和OGG。

在介紹幾種數(shù)字音頻格式之前，我們先來(lái)明晰一個(gè)概念——Bit Rate（比特率）。

在計(jì)算機(jī)領(lǐng)域中，所有的資料都是被數(shù)字化的，比特（Bit）是電腦中最小的數(shù)據(jù)單位，指一個(gè)0或者1的數(shù)，也就是數(shù)學(xué)上的二進(jìn)制數(shù)字，一個(gè)“0”或“1”，就是一個(gè)位。例如當(dāng)我們說(shuō)一個(gè)2位的數(shù)字，就是指它是一個(gè)兩位數(shù)的二進(jìn)制數(shù)字，有“00”、“01”、“10”、“11”這4種組合，分別代表十進(jìn)制中的0、1、2、3四個(gè)數(shù)字。

比特率是一種數(shù)字音樂(lè)壓縮效率的參考性指標(biāo)，比特率表示單位時(shí)間（1秒）內(nèi)傳送的比特?cái)?shù)bps（bit per second，位/秒），通常我們使用kbps（通俗地講就是每秒鐘1000比特）作為單位。CD中的數(shù)字音樂(lè)比特率為1411.2kbps（也就是記錄1秒鐘的CD音樂(lè)，需要1411.2×1024比特的數(shù)據(jù)）。音樂(lè)文件的比特率越高，意味著在單位時(shí)間（1秒）內(nèi)需要處理的數(shù)據(jù)量（Bit）越多，也就表明音樂(lè)文件的音質(zhì)越好。但是，比特率高時(shí)文件大小變大，會(huì)占據(jù)很多的存儲(chǔ)容量，MP3音樂(lè)文件最常用的bit rate是128kbps，MP3文件可以使用的比特率一般是8～320kbps。

--------------------------------------------------------------------------------

1、 WMA（Windows Media Audio，視窗媒體音頻）

作為微軟公司的多媒體壓縮方式，它是在Windows Media Technologies中只壓縮音頻數(shù)據(jù)的那一部分技術(shù)，音質(zhì)類似MP3，能以MP3一半的技術(shù)完成壓縮。它具有版權(quán)所有的Windows Media Rights Manager，可通過(guò)安裝在WMP（Windows Media Player，視窗媒體播放器）進(jìn)行播放。由于微軟和Windows的強(qiáng)大影響力，以及最重要的版權(quán)原因，美國(guó)的主要唱片公司EMI和BMG公司等正式確定使用由微軟公司開(kāi)發(fā)生產(chǎn)的WMA方式。相信，今后這種先進(jìn)方式會(huì)得到進(jìn)一步的普及。

2、 MP3（CBR、VBR、ABR）

MP3是目前使用用戶最多、應(yīng)用最為廣泛的有損壓縮數(shù)字音頻格式，在前文已經(jīng)做過(guò)解釋，在此不再?gòu)?fù)述。

CBR（Constant Bit Rate，固定比特率）

CBR是最古老最簡(jiǎn)單的MP3編碼（壓縮）方式。采用此法編碼時(shí)，整個(gè)文件的比特率都是一樣的，換言之，MP3文件每秒使用的比特率都是一樣。盡管音樂(lè)文件有復(fù)雜程度不同的段落，編碼器始終把比特率保持一致，除非你用最高音質(zhì)，否則，MP3文件中不同段落的音質(zhì)會(huì)有變化。越是復(fù)雜的段落，其音質(zhì)就越差。它的最大優(yōu)點(diǎn)是文件的尺寸固定，便于計(jì)算存儲(chǔ)的空間。

VBR（Variable Bit Rate，可變比特率）

VBR是一種可變編碼速率的MP3壓縮方式，其原理就是將一首歌的復(fù)雜部分用高比特率編碼，簡(jiǎn)單部分用低比特率編碼，通過(guò)這種動(dòng)態(tài)調(diào)整編碼速率的方式，進(jìn)一步得到音質(zhì)和文件體積之間的平衡。它的主要優(yōu)點(diǎn)是可以讓整首歌都能大致達(dá)到我們的音質(zhì)要求，缺點(diǎn)是編碼時(shí)無(wú)法估計(jì)壓縮出來(lái)的文件體積大小。

現(xiàn)在推出的MP3隨身聽(tīng)大部分都支持VBR了，不過(guò)有些機(jī)器雖然能夠播放VBR格式的歌曲，但是不能夠正確顯示播放時(shí)間，目前許多高品質(zhì)的MP3音樂(lè)都是采用VBR編碼的。

ABR（Average Bit Rate，平均比特率）

ABR是VBR的一種插值參數(shù)，它是在VBR的基礎(chǔ)上發(fā)展出來(lái)的一種編碼方式，是針對(duì)CBR較大的文件體積和VBR生成文件體積大小不定的特點(diǎn)創(chuàng)造了這種編碼模式。ABR在指定的文件大小內(nèi)，以每50幀（30幀約1秒）為一段，低頻和不敏感頻率使用相對(duì)低的流量，高頻和大動(dòng)態(tài)表現(xiàn)時(shí)使用高流量，可以作為VBR和CBR的一種折中選擇。

3、 WMA（Windows Media Audio，視窗媒體音頻）

WMA是微軟公司的多媒體壓縮方式，它是在微軟視窗媒體技術(shù)中只壓縮音頻數(shù)據(jù)的技術(shù)，音質(zhì)類似MP3。從壓縮比角度來(lái)說(shuō)，在低于192kbps的編碼速率條件下，WMA可以在同樣音質(zhì)條件下獲得比MP3文件更小的體積——甚至一半（但當(dāng)編碼速率高于192kbps時(shí)，普遍的反映是MP3的音質(zhì)要好于WMA）。微軟官方宣布的資料中稱WMA格式的可保護(hù)性極強(qiáng)，甚至可以限定播放機(jī)器、播放時(shí)間及播放次數(shù)，具有相當(dāng)?shù)陌鏅?quán)保護(hù)能力。

4、 WAV（聲音資源文件）

WAV是一種波形文件，直接記錄聲音的波形，未被壓縮，從CD抓取的音軌就是wav文件，體積大。

5、 ADPCM

ADPCM是Adaptive Differential Pulse Code Modulation的縮寫，全名為自適應(yīng)差分脈沖編碼，也是一種有損壓縮數(shù)字音頻格式。這個(gè)格式常用在MP3隨身聽(tīng)的錄音方面，它可以提供極高的壓縮比，一般128MB的MP3隨身聽(tīng)最長(zhǎng)可以記錄16小時(shí)的錄音，但追求錄音時(shí)間過(guò)長(zhǎng)是以犧牲音質(zhì)為代價(jià)的。

6、 AAC（Advanced Audio Coding，高級(jí)音頻編碼）

AAC是由Fraunhofer研究院（MP3格式的創(chuàng)造者）、杜比（DOLBY）試驗(yàn)室和AT&T（美國(guó)電話電報(bào)公司）共同研發(fā)出的一種有損壓縮音頻格式，是MPEG-2規(guī)范的一部分。與MP3相比，AAC增加了對(duì)立體聲的完美再現(xiàn)、碼流效果音掃描、多媒體控制、降噪優(yōu)化等MP3音頻格式所沒(méi)有的特性，同時(shí)還支持更多種采樣率和比特率、多種語(yǔ)言的兼容能力、更高的解碼效率。總之，AAC可以在比MP3文件縮小30％的前提下提供更好的音質(zhì)。

不過(guò)，在目前的MP3隨身聽(tīng)上，僅有少數(shù)幾家應(yīng)用了這一格式。

7、 ASF（Advanced Streaming Format，高級(jí)流動(dòng)格式）

ASF是微軟公司針對(duì)Real公司開(kāi)發(fā)的新一代網(wǎng)上流式數(shù)字音頻壓縮技術(shù)。這種壓縮技術(shù)的特點(diǎn)是同時(shí)兼顧了保真度和網(wǎng)絡(luò)傳輸需求，所以具有一定的先進(jìn)性。也是由于微軟的影響力，這種音頻格式現(xiàn)在正獲得越來(lái)越多的支持。

8、 OGG Vorbis格式

OGG是一個(gè)龐大的多媒體開(kāi)發(fā)計(jì)劃的項(xiàng)目名稱，涉及視頻音頻等方面的編碼開(kāi)發(fā)。OGG Vorbis是高質(zhì)量的音頻編碼方案，它比MP3先進(jìn)在于可以支持多聲道編碼。官方數(shù)據(jù)顯示，OGG Vorbis可以在相對(duì)較低的數(shù)據(jù)速率下實(shí)現(xiàn)比MP3更好的音質(zhì)。但由于隨身聽(tīng)使用耳機(jī)播放的局限，即便是經(jīng)過(guò)多聲道（兩聲道以上）編碼的OGG Vorbis格式音頻文件，用耳機(jī)收聽(tīng)也感受不到環(huán)繞效果，因?yàn)槎鷻C(jī)只提供雙聲道輸出。

什么是MP3

摘自：http://zhidao.baidu.com/question/2839473.html?fr=qrl

MP3的全稱是Moving Picture Experts Group, Audio Layer III,它所使用的技術(shù)是在VCD

MPEG聲音標(biāo)準(zhǔn)提供三個(gè)獨(dú)立的壓縮層次：層1(Layer 1)、層2(Layer 2)和層3(Layer 3)，用戶對(duì)層次的選擇可在復(fù)雜性和聲音質(zhì)量之間進(jìn)行權(quán)衡。
① 層1的編碼器最為簡(jiǎn)單，編碼器的輸出數(shù)據(jù)率為384 kb/s，主要用于小型數(shù)字盒式磁帶(digital compact cassette，DCC)。
② 層2的編碼器的復(fù)雜程度屬中等，編碼器的輸出數(shù)據(jù)率為256 kb/s～192 kb/s，其應(yīng)用包括數(shù)字廣播聲音(digital broadcast audio，DBA)、數(shù)字音樂(lè)、CD-I(compact disc-interactive)和VCD(video compact disc)等。
③ 層3的編碼器最為復(fù)雜，編碼器的輸出數(shù)據(jù)率為64 kb/s，主要應(yīng)用于ISDN上的聲音傳輸。

Mpeg-1 lay 3支持的采樣率為32,44.1,48khz,比特率支持32---320kbps
Mpeg-2 lay 3支持的采樣率為16,22.05,24khz,比特率支持8---160kbps
Fraunhofer對(duì)此又進(jìn)行擴(kuò)展，將原來(lái)MPEG-2所支持的低采樣率再除以2，得到： 8, 11.025, 和 12 kHz，比特率跟MPEG-2相同，稱為 "MPEG 2.5"。
MP3文件可以以不同比特率進(jìn)行編碼，比特率越小，壓出來(lái)的文件也越小，當(dāng)然失真也越大。至于它的品質(zhì)，只要不是太夸張的壓縮比，一般人的耳朵是聽(tīng)不出來(lái)的，一般來(lái)說(shuō)128kbps已經(jīng)相當(dāng)于CD的音質(zhì)了。
Mp3是怎樣壓縮數(shù)據(jù)的
MP3 壓縮時(shí)運(yùn)用到五個(gè)重要的技巧，分別是最小聽(tīng)覺(jué)門檻判定 (The minimal audition threshold) ，遮蔽效應(yīng) (The Masking effect) ，位元儲(chǔ)存槽 (The reservoir of byres) ， The Joint Stereo ，和 Huffman 編碼。
最小聽(tīng)覺(jué)門檻判定是一種減少資料量的手段，因?yàn)槿硕鷮?duì)不同頻率的聲音聽(tīng)到的音量反應(yīng)不是平直的，因此我們可以將大部分的紀(jì)錄資訊集中在人耳最靈敏的 2kHz 到 5kHz ，其余頻率分配比較少的容量紀(jì)錄。
遮蔽效應(yīng)也是聽(tīng)覺(jué)心理學(xué)模型 (Psychoacoustic models)的一種，它是指一個(gè)聲音A能感知的閥值因另一個(gè)聲音B的出現(xiàn)而提高的現(xiàn)象，這時(shí)B叫遮蔽聲，A叫被遮蔽聲；在視覺(jué)上呈現(xiàn)的效果就是在大太陽(yáng)下你比較難看到天空中飛翔的鳥，聽(tīng)覺(jué)上的涵義就是當(dāng)有一個(gè)音量或音色特別突出的聲音出現(xiàn)，其他細(xì)小的聲音就比較難被察覺(jué)，就像是管弦樂(lè)團(tuán)齊奏時(shí)我們很難發(fā)現(xiàn)有觀眾的咳嗽聲，盡管咳嗽的音量與沒(méi)有其他聲音時(shí)其實(shí)是相同的。因此在編碼時(shí)我們不需要把所有的聲音細(xì)節(jié)都編進(jìn)去，而該把資料拿去紀(jì)錄比較突出容易引起注意的聲音。
在解釋前位元儲(chǔ)存槽之前要先說(shuō)明 MP3 的幾個(gè)屬性 CBR 和 VBR 。 CBR 是 Constant Bitrate 的縮寫，也就是說(shuō)該 MP3 每秒鐘的資料流量是固定的，常見(jiàn)的 MP3 都是以 CBR 編碼，好處是壓縮速度快。相對(duì)的 VBR 是 Variable Bitrate的縮寫，每秒鐘的流量是可以變化的，好處是在訊號(hào)復(fù)雜時(shí)用比較多的容量去紀(jì)錄，波型簡(jiǎn)單時(shí)就用比較低的流量，以有效利用空間。 CBR 的缺點(diǎn)就是每秒鐘的流量都相同，很容易造成空間的浪費(fèi)，因此有 reservoir of byres 的出現(xiàn)，用途就是當(dāng)波型簡(jiǎn)單時(shí)就不要用那么大的流量，把多余的空間保留下來(lái)儲(chǔ)存將來(lái)比較復(fù)雜的波性資料，維持流量的大小，達(dá)到類似 VBR 的效果。 VBR 的 MP3 并不需要 reservoir of byres 。
Joint Stereo 是一種立體聲編碼技巧，主要分為 Intensity Stereo(IS) 和 Mid/Side (M/S) stereo 兩種。 IS 的是在比較低流量時(shí)使用，利用了人耳對(duì)于低頻訊號(hào)指向性分辨能力的不足，將音訊資料中的低頻分解出來(lái)合成單聲道資料，剩余的高頻資料則合成另一個(gè)單聲道資料，并另外紀(jì)錄高頻資料的位置資訊，來(lái)重建立體聲的效果。例如鋼琴獨(dú)奏的錄音就可以利用這種方法在有限的資料流量中減少音場(chǎng)資訊卻大幅增加音色資訊。Mid/Side (M/S) stereo 在左右聲道資料相似度大時(shí)常被用到，紀(jì)錄方式是將左右聲道音訊合并 (L+R) 得到新的一軌，再將左右聲道音訊相減 (L-R) 得到另外一軌，然后再將這兩軌資料用上面提到聽(tīng)覺(jué)心理學(xué)模型與濾波器處理。 Mid/Side (M/S) stereo 與 IS 一樣的是利用部分相位 (phase) 資訊的損失來(lái)?yè)Q得較高的音色紀(jì)錄資訊。一般的 MP3 是 Mid/Side stereo 和 Intensity Stereo 交替使用的，視資料內(nèi)容與流量而定。如果是更高流量如 160kbps 以上的 MP3 ，則可以單獨(dú)將立體聲的兩個(gè)聲道獨(dú)立編碼，以保存相位資訊。
Huffman 編碼 (coding) 是一種常見(jiàn)的無(wú)失真壓縮方案。當(dāng) PCM 訊號(hào)被分成好幾個(gè)頻段并經(jīng)過(guò)以上的處理之后，最后就是經(jīng)過(guò)一種類似 FFT(Fast Fourier Transforms) 的運(yùn)算稱為 MDCT(Modified Discrete Cosine Transform) ，將波型轉(zhuǎn)換為一連串的系數(shù)。這些系數(shù)最后就要經(jīng)過(guò) Huffman 編碼來(lái)做最后的壓縮。 Huffman 編碼的原理是將比較常出現(xiàn)的字串用特定的符號(hào)表示，壓縮后就得到一個(gè)紀(jì)錄每個(gè)符號(hào)代表的字串的編碼表以及一連串由各符號(hào)組成的資料內(nèi)容。 Huffman 編碼可以節(jié)省約 20% 的空間，而也因?yàn)榻?jīng)過(guò)了 Huffman 編碼，我們可以發(fā)現(xiàn)用 WinZip 、 WinRAR 之類的壓縮軟體并沒(méi)有辦法把 MP3壓縮小多少，理由就是因?yàn)檫@些壓縮軟體也是利用類似 Huffman 編碼的技巧，因此壓縮程度有限。(以上關(guān)于 MP3 編碼的資料取自 http://www.mp3-tech.org/tech.html 。)
MP3 播放時(shí)的運(yùn)算遠(yuǎn)比編碼時(shí)簡(jiǎn)單，只要先經(jīng)過(guò) Huffman 解碼再由 MDTC 的逆運(yùn)算重建波型就可以了，值得注意的是 MP3不同于PCM沒(méi)有bits的概念，我們可以自由使用 16bits 或是 20bits 甚至 24bits 的運(yùn)算精度來(lái)重建波型。

posted on 2008-06-05 09:37 YODA 閱讀(2183) 評(píng)論(4) 編輯收藏

常用鏈接

留言簿

隨筆檔案

文章分類

文章檔案

搜索

最新評(píng)論

閱讀排行榜

評(píng)論排行榜


只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。




網(wǎng)站導(dǎo)航: 博客園 IT新聞 Chat2DB C++博客博問(wèn) 管理