Skype可以算是目前最流行的语音通讯应用了。从2003年发布起,Skype就同时支持微软Windows、Linux和苹果Mac系统,方便的跨平台和良好的通话质量使其一经推出就广受好评,也是我个人使用最早的一款语音通讯应用[Linux版],当时就对其语音品质留下了不错的印象。
不仅可以在PC或移动平台使用互联网进行语音通话,Skype也具备拨打电话号码功能,当然电话功能并非免费服务,需要和电话一样购买号码,充值通讯费用,最早推出的时候费用从0.02~2美元不等,价格并不便宜,真正吸引人的是在2007年以后统一的0.03欧元/分钟价格,而当时还推出了许多一些基于Skype的非智能手机和电话座机……而今天智能手机已经普及到世界各个角落,用户更乐意通过客户端使用免费的网络语音和视频通信功能。
随着Skype的火热和规模扩大,越来越多的软件企业开始打VoIP的主意,涌现了大量的同质化应用,而在用户基础更广泛的各类即时信息通讯应用如QQ、微信等社交类应用集成语音和视频通讯功能后,又很快消失。而Skype也转手过两次,2005年,eBay花了26亿美元将其收购;而在2011年,微软以85亿美元的高价将Skype整个企业收购至旗下,并花了3年时间整合取代了原先微软自己的MSN Messenger。目前Skype客户端间的语音通讯占了全球国际通讯的40%市场份额,并仍在上升期。
要理解Skype的优势,首先是功能和跨平台上,目前Skype支持硬件和操作系统极为广泛,包括Android、iOS、WindowsPhone移动平台,PC平台的Windows、Linux、MacOS系统,甚至是一些不太热门的操作系统平台和硬件,这使得Skype有稳定忠实的用户群体,同时Skype支持多人语音会议和视频功能。
在技术特点上,目前Skype采用自创的Opus开源音频编码,这是一种有损音频格式,支持码率从GSM水平的8kbps到最高510kbps,采样率最高支持48kHz,当然Skype的语音功能并不需要如此高的品质,Skype的语音功能只使用Opus其中的6~40kbps码率,8~24kHz采样率范围,被称为SILK编码。SILK编码平均延迟为25毫秒,并能自行适应网络连接调整品质。目前国内主流的3G和4G网络制式里,TD-SCDMA的数据传输速率就已经远远超过Skype SILK最高带宽需求,足够保障其语音通话品质。而Opus编码是目前VoIP的语音编码标准规范之一,这也决定了Skype与QQ微信等应用的本质差距:Skype语音功能是核心应用,QQ和微信等则是以社交为主,语音只是附加功能。
测试Skype的通话品质,和Soomal平时测试手机语音通话降噪的方式并无区别,根据ITU的相关技术测试规范,在环境噪音32dB以下的室内进行,为了保证品质一致性,设备均使用WiFi连接,接收端录音采样率也统一至和GSM一样的8KHz。但Skype的测试却给我们带来了不小的麻烦。GSM语音通话编码是连续的,而Skype的声音延迟会不断变化,这也意味着录音的结果中与原始信号相比总会有几十数毫秒的误差,虽然对日常使用没有影响,但对降噪进行测定的脚本是直接对比信号的波形,不同步的后果就是信号无法重合,导致测试结果不准确,我们测试了目前三个主流移动平台的多款设备都存在类似状况。为了得到正确的测试结果,需要对录音的进行调整同步……这个现象也让我们开始复查比较QQ和以往GSM通话测试测评中录音的延迟状况,所幸的是并不存在这种现象,Skype仅仅是特例,但使得原定昨天发布的测评出现推迟,对此向读者致歉。
测试项目[Skype@Galaxy S4] | 嘈杂人群 | 背景音乐 | 粉红噪声 | 路边 | 人声 |
总降噪,dB[越高越好] | 16.5 | 17.5 | 19.6 | 18.7 | 18.4 |
信噪提升,dB[越高越好] | 13.9 | 13.9 | 15.7 | 15.2 | 7.1 |
电平增益,dB[-4~3] | -0.3 | -0.2 | -0.3 | -1.2 | -0.3 |
测试项目[QQ@Galaxy S4] | 嘈杂人群 | 背景音乐 | 粉红噪声 | 路边 | 人声 |
总降噪,dB[越高越好] | 24.5 | 15.1 | 33.5 | 31.1 | 21.2 |
信噪提升,dB[越高越好] | 1.3 | 1.9 | 20.8 | 9.0 | 2.1 |
电平增益,dB[-4~3] | -11.0 | -6 | -9.5 | -8.8 | -5.0 |
测试项目[Skype@MX4 Pro] | 嘈杂人群 | 背景音乐 | 粉红噪声 | 路边 | 人声 |
总降噪,dB[越高越好] | 20.6 | 15.5 | 28.6 | 30.1 | 18.3 |
信噪提升,dB[越高越好] | 16.2 | 10.2 | 23.0 | 25.5 | 13.6 |
电平增益,dB[-4~3] | -1.9 | -0.6 | -3.0 | -2.8 | 2.3 |
测试项目[QQ@MX4 Pro] | 嘈杂人群 | 背景音乐 | 粉红噪声 | 路边 | 人声 |
总降噪,dB[越高越好] | 36.0 | 31.0 | 38.4 | 39.2 | 24.6 |
信噪提升,dB[越高越好] | 15.7 | 7.1 | 15.0 | 15.8 | 5.3 |
电平增益,dB[-4~3] | -6.3 | -6.2 | -7.2 | -6.7 | -3.5 |
测试项目[Skype@iPhone 5C] | 嘈杂人群 | 背景音乐 | 粉红噪声 | 路边 | 人声 |
总降噪,dB[越高越好] | 11.4 | 11.0 | 12.2 | 14.8 | 16.0 |
信噪提升,dB[越高越好] | 12.0 | 10.1 | 12.3 | 14.2 | 14.0 |
电平增益,dB[-4~3] | -0.5 | 0.4 | -0.8 | -1.0 | 2.5 |
信噪比提升[Singal-to-Noise Ratio Improvement,SNRI]:降噪后的语音信号和未经过降噪的标准原始信号相比,信噪比提升的幅度通常应在4dB以上。
电平增益[SNRI-to-NPLR difference,DSN]:未降噪原始标准信号和降噪后电平差异, 降噪处理通常会导致语音信号电平有所衰减,为了提高通话的清晰度,手机通产还需要对信号进行适当的增益处理后才能发送,理论上保持降噪前后语音信号电平一 致[0]为最平衡状况,由于标准信号电平峰值为-2.5dB,过高的增益会导致信号溢出,意味着频繁的爆音;过低则自然是语音信号强度不够,声音太小,导致对方难以听清。
降噪测试成绩仅做为同等测试环境和条件下的测试参考,不可与使用类似测试手段的第三方网站或手机厂商官方技术数据进行对比。
由于时间和精力的原因,我们只调整了其中三项的测试录音延迟并获得相对准确的测试成绩。首先从录入增益来看,Skype的表现要远比QQ自带的语音功能稳定,其中Galaxy S4录入电平基本接近测试信号标准,而MX4 Pro高于标准信号电平约2dB,vivo Xplay 3S、XShot等机型则低于标准约1dB,电平较低的iPhone 5C约2~3dB。而Xplay 3S、XShot的QQ语音功能是很难正常使用的。
Skype并不追求环境噪音的过滤效果,而是语音信息的稳定性,在不同的机型哪怕是使用iPod Touch 4均可以获得较为清晰和稳定的语音信号,其通话品质可以满足正常户外噪音环境系下的使用,语音品质也明显高于普通的GSM通话或QQ类语音应用的表现。语音通讯作为Skype的主业,远比其它通讯社交类应用的附加语音功能要稳定和可靠,很显然光依靠客户设备的录音性能是做不到这点的,Skype在语音传输过程中有自己的调整算法和技术标准以保证用户体验的一致性。
智能手机上的VoIP应用众多,例如在国内已经无法正常使用的Viber我们已无法进行测试,但通过日常使用的印象,其通话品质相比Skype差距也是非常明显的。国内用户基础庞大的社交类应用微信,其语音使用方式并不是的点对点实时通信,而是录音留言和文件传输模式,却反而人气旺盛,曾让电信运营商大加防范,而微信的语音功能品质如何?Soomal将于2015年元旦发布微信的语音通话功能测评。