AAC/MP3/ATRAC3三种音频文件有损压缩编码客观测试报告
赵宇为 于 2013.08.02 11:28:06 | 源自:www.soomal.com | 版权:原创
平均/总评分:09.51/371

在随身听与数字音频播放器近20年的发展中,音频内容的存储与编码技术是软硬件结合最为紧密的一组核心技术。CD标准的制定正是因为考虑到一张Audio CD可以容纳下大多数大型交响乐的演奏时间[据说是以贝多芬第九交响曲时长为标准之一]。而对于随身听来说,还要考虑到机器的体积。MD发布于上世纪90年代初,而它近200M的容量为了能够放下一张CD相同的时长,所以它存储的格式必须进行压缩。虽然今天看来闪存发展神速,但大家并不会满足只在闪存式随身听里只存放一张CD专辑的内容,对于存储空间需求仍在增长,甚至仍显不足。从随身听阵营来看,MP3编码与MP3播放器占绝对主流;苹果公司使用AAC销售正版音乐,但也支持MP3格式;索尼MD产品是ATRAC3编码的主要载体,虽然它们其中有些已经退出了舞台,但在历史上这三种有损编码仍然是应用最多的高品质有损编码算法。

三种有损压缩算法历史回顾

要谈“有损”,也许我们也可以顺便了解什么是“无损”?而更重要的是从逻辑上明确所谓的“无损“或”有损“是以什么对象来定义的。在音频文件中,我们常说的有损或无损的参照源对象,一般是指PCM编码下的音频文件,而从Audio CD抓轨得到的音频文件是以16bit/44.1kHz标准 PCM编码的音频文件,大家看到这样的文件一般以wav为扩展名,俗称它WAV文件,其他的编码时对文件所占的存储空间进行了压缩,而压缩不带来数据内容的丢失即无损压缩,而压缩数据细节而造成不可逆的细节丢失即位有损。具体来说,AAC、MP3或ATRAC3对WAV文件进行压缩,它们所占的存储空间会比PCM编码源文件有几倍至十几倍的减少,而这个过程中是损失了一些被认为相对难以被人耳察觉的音乐信息的。它们各自的压缩方法很难在这里说清楚,而通过简单的客观测试,我们希望可以展示出其中的差别。

AAC、MP3和ATRAC三种编码,当然以“MP3”知名度最高,它甚至可以作为硬件播放器的代名词。有时候它还会受到不公正的待遇,当大家对于质量从网络下载的音乐音质不满时,播放器的声音不好听时,都会抱怨一句“是烂MP3吧?”这听上去不那么严谨的口头禅,显然对MP3技术是不公正的,但我们从中更能够看到MP3编码技术对于数字音乐传播的影响是如此之大。而关于MP3的编码特性以及相关播放器的历史,就不再这里进一步介绍了。大家可以参考以下两篇文章了解相关知识。

而AAC编码和ATRAC编码,大家相对陌生,但它们又不像OGG、MPC等编码那样小众。对AAC编码熟悉的用户很可能是因为使用iPod或者从使用iTunes Store购买音乐开始。AAC全称Advanced Audio Coding,早期AAC基于MPEG2规范,而我们目前使用的AAC标准,全称为MPEG4-AAC。从压缩算法来说,它加入了更多的优秀算法,理论上相比MP3有更高的品质,但任何编码都有擅长的区间,这点来说并不绝对。

AAC和MP3仍然和我们的日常应用紧密相关,iTunes Store的正版音乐销量占整个唱片产业销量非常大比例。而MP3虽然在文件管理功能上没有像AAC那样可进行版权认证的功能,但越来越多的在线播放器通过账户绑定的方法一样可以提供正版MP3的销售或免费试听。在iTunes Store上销售的歌曲码率已经逐步提升到了256kbps。

ATRAC3随着索尼发布MD播放器而随之问世,它来自于索尼公司,ATRAC3是比较封闭的一种音频压缩算法,大多的应用于索尼MD产品。在索尼发布MDLP即之前测试R900及同代机型之前,ATRAC3仅支持一种压缩码率,即133kbps,从压缩完成后文件的数据容量来看似乎与128kbps的MP3处于同样水准。而索尼在NetMD和HiMD发布时,扩展了ATRAC3 Plus标准的编码。不但可以支持无损压缩,而且最高码率可以达到352kbps。目前PS Vita、日版的索尼Xperia Z等产品仍可支持ATRAC3 Plus编码的音乐。

测试方法

今天的测试方法,在文章中将完全使用客观的手段,而在文章最后我们只做了两段音频供大家下载对比。测试中,我们使用Cooledit软件,对压缩过和没有压缩过的文件的波形图和频谱图进行对比,大家应该很容易看出其中差别。

编码类型 MP3 AAC ATRAC3
编码器 Lame 3.98 iTunes 11 SonicStage 4.3
编码品质 CBR,最高品质 默认 默认
文件码率 128kbps/320kbps 128kbps/256kbps 133kbps/256kbps/352kbps

我们准备了两首从正版CD中抓轨得到的音乐,为了避免心理暗示和对版权的不尊重,我们不在这里写出曲目的名称,但大家从图中可以看到它的品质是没有问题的。这两首曲目分别以”曲目一”和“曲目二”命名,在以下图片中可以看到标标注[注:曲目一为大编制交响乐,动态范围很大;曲目二为人声,配器高频细节较多。]。除此之外,我们还截取了一段20Hz-20kHz的粉红噪声的光频谱图进行对比说明。

对于MP3、ATRAC3和AAC,我们使用了几种不同品质的编码方式。MP3使用Lame 3.98进行编码,ATRAC3使用SonicStage 4.3进行编码,AAC使用最新的iTunes进行编码。

我们用以下两张图介绍一下Cooledit中频谱图的读图方法。首先,左侧一张图为曲目一在CD抓轨后PCM编码WAV文件的波形图,它是这首音乐的波形图。图中横坐标为时间轴,而纵坐标为波形的振幅。右侧一张图为曲目一的PCM编码WAV文件的频谱光视图,熟悉数码多的网友对这张图的作用不会陌生,但在这里我们仍然做简单说明。大家从图中看到从接近白色亮度的光谱也有比较暗的接近黑色的间隙,还有红色、橙色等分布不同光谱。图中这些不同颜色的“光频谱”代表了信号的强度,注意,是强度!通俗的说,此时音频输出的声压越高,这部分对应的图形越亮。而信号的频率如何显示?就是图片中的纵坐标。大家一定要注意看这张图片中纵坐标对应的频率范围和信号所在频率范围的区间,因为有损压缩往往会在高频不会有不同程度的损失。

我们如何可以做到这些测试图表展示呢?这还得感谢它们是有损的算法,有损的过程是不可逆的,我们对测试文件进行编码,然后再将它转换为WAV封装的格式。表面上看,它仍然是WAV,但其实它的内容已经在前一次的”转码“中损失掉了。所以,我们还给大家提供了我们测试曲目一和曲目二的十多秒钟的片段,大家可以自己评判一下哪一个片段的音质更好?欢迎大家交流。

测试波形及频谱图对比

MP3组对比

ATRAC3组对比

AAC组对比

128kbps组曲目一对比

256kbps组曲目一对比

320kbps组曲目一对比

128kbps组曲目二对比

256kbps组曲目二对比

320kbps组曲目二对比

128kbps组粉红噪声对比

256kbps组粉红噪声对比

320kbps组粉红噪声对比

测试音乐片段反馈方法:

为了不对大家造成心理暗示,所以我们具体不会告诉大家以下两段测试音乐到底使用了怎么样的编码品质,但可以确定,是不同的编码格式。在曲目一和曲目二中,都分为前后两部分,这两部分间隔5秒左右。而前后两个部分,都分为很短的4个小段,中间间隔大概1秒。曲目一的八段按时间顺序分别为A1、A2、A3、A4\B1、B2、B3、B4;曲目二的八段按时间顺序分别为C1、C2、C3、C4\D1、D2、D3、D4。其中A1、B1、C1、D1均为没有压缩过的WAV的节选片段。欢迎大家踊跃提交反馈信息:例如A1>A2>A3=A4。

转发到新浪微博 转发到腾讯微博 RSS订阅 收藏本文 本文代码
请您评分 1 2 3 4 5 6 7 8 9 10
183.044.145.***
183.044.145.***
发表于2017.05.19 22:53:07
172
221.224.095.***
221.224.095.***
发表于2016.11.11 15:32:11
171
115.239.228.***
115.239.228.***
发表于2016.06.02 00:47:51
170
202.100.221.***
202.100.221.***
发表于2016.01.05 12:20:30
169
发表于2015.12.07 21:05:37
167
183.064.115.***
183.064.115.***
发表于2015.11.26 10:17:53
166
120.193.236.***
120.193.236.***
发表于2015.06.10 14:50:43
164
110.052.103.***
110.052.103.***
发表于2015.01.02 10:46:12
163
该为读者揭晓最终答案了!
发表于2014.09.28 10:32:11
161
115.205.005.***
115.205.005.***
发表于2014.09.13 10:20:48
158
099.244.006.***
099.244.006.***
发表于2014.06.11 07:56:45
156
提示本贴不可匿名回复,回复等级为:0 ,您现在正处在潜水状态
回复
验证码
9495 为防止广告机贴垃圾,不得已而为之
表情
正文