AAC/MP3/ATRAC3三種音頻檔案有損壓縮編碼客觀測試報告
趙宇為 于 2013.08.02 11:28:06 | 源自:www.soomal.com | 版權:原創
平均/總評分:09.51/371

在隨身聽與數字音頻播放器近20年的發展中,音頻內容的存儲與編碼技術是軟硬體結合最為緊密的一組核心技術。CD標準的制定正是因為考慮到一張Audio CD可以容納下大多數大型交響樂的演奏時間[據說是以貝多芬第九交響曲時長為標準之一]。而對于隨身聽來說,還要考慮到機器的體積。MD發布于上世紀90年代初,而它近200M的容量為了能夠放下一張CD相同的時長,所以它存儲的格式必須進行壓縮。雖然今天看來閃存發展神速,但大家并不會滿足只在閃存式隨身聽里只存放一張CD專輯的內容,對于存儲空間需求仍在增長,甚至仍顯不足。從隨身聽陣營來看,MP3編碼與MP3播放器占絕對主流;蘋果公司使用AAC銷售正版音樂,但也支援MP3格式;索尼MD產品是ATRAC3編碼的主要載體,雖然它們其中有些已經退出了舞臺,但在歷史上這三種有損編碼仍然是應用最多的高品質有損編碼算法。

三種有損壓縮算法歷史回顧

要談“有損”,也許我們也可以順便了解什么是“無損”?而更重要的是從邏輯上明確所謂的“無損“或”有損“是以什么對象來定義的。在音頻檔案中,我們常說的有損或無損的參照源對象,一般是指PCM編碼下的音頻檔案,而從Audio CD抓軌得到的音頻檔案是以16bit/44.1kHz標準 PCM編碼的音頻檔案,大家看到這樣的檔案一般以wav為擴展名,俗稱它WAV檔案,其他的編碼時對檔案所占的存儲空間進行了壓縮,而壓縮不帶來數據內容的丟失即無損壓縮,而壓縮數據細節而造成不可逆的細節丟失即位有損。具體來說,AAC、MP3或ATRAC3對WAV檔案進行壓縮,它們所占的存儲空間會比PCM編碼源檔案有幾倍至十幾倍的減少,而這個過程中是損失了一些被認為相對難以被人耳察覺的音樂資訊的。它們各自的壓縮方法很難在這里說清楚,而通過簡單的客觀測試,我們希望可以展示出其中的差別。

AAC、MP3和ATRAC三種編碼,當然以“MP3”知名度最高,它甚至可以作為硬體播放器的代名詞。有時候它還會受到不公正的待遇,當大家對于質量從網路下載的音樂音質不滿時,播放器的聲音不好聽時,都會抱怨一句“是爛MP3吧?”這聽上去不那么嚴謹的口頭禪,顯然對MP3技術是不公正的,但我們從中更能夠看到MP3編碼技術對于數字音樂傳播的影響是如此之大。而關于MP3的編碼特性以及相關播放器的歷史,就不再這里進一步介紹了。大家可以參考以下兩篇文章了解相關知識。

而AAC編碼和ATRAC編碼,大家相對陌生,但它們又不像OGG、MPC等編碼那樣小眾。對AAC編碼熟悉的用戶很可能是因為使用iPod或者從使用iTunes Store購買音樂開始。AAC全稱Advanced Audio Coding,早期AAC基于MPEG2規范,而我們目前使用的AAC標準,全稱為MPEG4-AAC。從壓縮算法來說,它加入了更多的優秀算法,理論上相比MP3有更高的品質,但任何編碼都有擅長的區間,這點來說并不絕對。

AAC和MP3仍然和我們的日常應用緊密相關,iTunes Store的正版音樂銷量占整個唱片產業銷量非常大比例。而MP3雖然在檔案管理功能上沒有像AAC那樣可進行版權認證的功能,但越來越多的在線播放器通過賬戶綁定的方法一樣可以提供正版MP3的銷售或免費試聽。在iTunes Store上銷售的歌曲碼率已經逐步提升到了256kbps。

ATRAC3隨著索尼發布MD播放器而隨之問世,它來自于索尼公司,ATRAC3是比較封閉的一種音頻壓縮算法,大多的應用于索尼MD產品。在索尼發布MDLP即之前測試R900及同代機型之前,ATRAC3僅支援一種壓縮碼率,即133kbps,從壓縮完成后檔案的數據容量來看似乎與128kbps的MP3處于同樣水準。而索尼在NetMD和HiMD發布時,擴展了ATRAC3 Plus標準的編碼。不但可以支援無損壓縮,而且最高碼率可以達到352kbps。目前PS Vita、日版的索尼Xperia Z等產品仍可支援ATRAC3 Plus編碼的音樂。

測試方法

今天的測試方法,在文章中將完全使用客觀的手段,而在文章最后我們只做了兩段音頻供大家下載對比。測試中,我們使用Cooledit軟體,對壓縮過和沒有壓縮過的檔案的波形圖和頻譜圖進行對比,大家應該很容易看出其中差別。

編碼類型 MP3 AAC ATRAC3
編碼器 Lame 3.98 iTunes 11 SonicStage 4.3
編碼品質 CBR,最高品質 預設 預設
檔案碼率 128kbps/320kbps 128kbps/256kbps 133kbps/256kbps/352kbps

我們準備了兩首從正版CD中抓軌得到的音樂,為了避免心理暗示和對版權的不尊重,我們不在這里寫出曲目的名稱,但大家從圖中可以看到它的品質是沒有問題的。這兩首曲目分別以”曲目一”和“曲目二”命名,在以下圖片中可以看到標標注[注:曲目一為大編制交響樂,動態范圍很大;曲目二為人聲,配器高頻細節較多。]。除此之外,我們還截取了一段20Hz-20kHz的粉紅噪聲的光頻譜圖進行對比說明。

對于MP3、ATRAC3和AAC,我們使用了幾種不同品質的編碼方式。MP3使用Lame 3.98進行編碼,ATRAC3使用SonicStage 4.3進行編碼,AAC使用最新的iTunes進行編碼。

我們用以下兩張圖介紹一下Cooledit中頻譜圖的讀圖方法。首先,左側一張圖為曲目一在CD抓軌后PCM編碼WAV檔案的波形圖,它是這首音樂的波形圖。圖中橫坐標為時間軸,而縱坐標為波形的振幅。右側一張圖為曲目一的PCM編碼WAV檔案的頻譜光視圖,熟悉數碼多的網友對這張圖的作用不會陌生,但在這里我們仍然做簡單說明。大家從圖中看到從接近白色亮度的光譜也有比較暗的接近黑色的間隙,還有紅色、橙色等分布不同光譜。圖中這些不同顏色的“光頻譜”代表了訊號的強度,注意,是強度!通俗的說,此時音頻輸出的聲壓越高,這部分對應的圖形越亮。而訊號的頻率如何顯示?就是圖片中的縱坐標。大家一定要注意看這張圖片中縱坐標對應的頻率范圍和訊號所在頻率范圍的區間,因為有損壓縮往往會在高頻不會有不同程度的損失。

我們如何可以做到這些測試圖表展示呢?這還得感謝它們是有損的算法,有損的過程是不可逆的,我們對測試檔案進行編碼,然后再將它轉換為WAV封裝的格式。表面上看,它仍然是WAV,但其實它的內容已經在前一次的”轉碼“中損失掉了。所以,我們還給大家提供了我們測試曲目一和曲目二的十多秒鐘的片段,大家可以自己評判一下哪一個片段的音質更好?歡迎大家交流。

測試波形及頻譜圖對比

MP3組對比

ATRAC3組對比

AAC組對比

128kbps組曲目一對比

256kbps組曲目一對比

320kbps組曲目一對比

128kbps組曲目二對比

256kbps組曲目二對比

320kbps組曲目二對比

128kbps組粉紅噪聲對比

256kbps組粉紅噪聲對比

320kbps組粉紅噪聲對比

測試音樂片段反饋方法:

為了不對大家造成心理暗示,所以我們具體不會告訴大家以下兩段測試音樂到底使用了怎么樣的編碼品質,但可以確定,是不同的編碼格式。在曲目一和曲目二中,都分為前后兩部分,這兩部分間隔5秒左右。而前后兩個部分,都分為很短的4個小段,中間間隔大概1秒。曲目一的八段按時間順序分別為A1、A2、A3、A4\B1、B2、B3、B4;曲目二的八段按時間順序分別為C1、C2、C3、C4\D1、D2、D3、D4。其中A1、B1、C1、D1均為沒有壓縮過的WAV的節選片段。歡迎大家踴躍提交反饋資訊:例如A1>A2>A3=A4。

轉發到新浪微博 轉發到騰訊微博 RSS訂閱 收藏本文 本文代碼
請您評分 1 2 3 4 5 6 7 8 9 10
183.044.145.***
183.044.145.***
發表于2017.05.19 22:53:07
172
221.224.095.***
221.224.095.***
發表于2016.11.11 15:32:11
171
115.239.228.***
115.239.228.***
發表于2016.06.02 00:47:51
170
202.100.221.***
202.100.221.***
發表于2016.01.05 12:20:30
169
發表于2015.12.07 21:05:37
167
183.064.115.***
183.064.115.***
發表于2015.11.26 10:17:53
166
120.193.236.***
120.193.236.***
發表于2015.06.10 14:50:43
164
110.052.103.***
110.052.103.***
發表于2015.01.02 10:46:12
163
該為讀者揭曉最終答案了!
發表于2014.09.28 10:32:11
161
115.205.005.***
115.205.005.***
發表于2014.09.13 10:20:48
158
099.244.006.***
099.244.006.***
發表于2014.06.11 07:56:45
156
提示本貼不可匿名回復,回復等級為:0 ,您現在正處在潛水狀態
回復
驗證碼
0260 為防止廣告機貼垃圾,不得已而為之
表情
正文