NVIDIA 英伟达 Tegra3 图睿3 处理器技术与应用分析
赵宇为 于 2011.11.15 00:27:48 | 源自:www.soomal.com | 版权:原创 | 平均/总评分:09.77/127

11月9日,NVIDIA英伟达正式发布新一代基于ARM核心架构的处理器Tegra3,这也是首个采用Cortex-A9四核心设计的处理器。此次NVIDIA提出vSMP专利技术[Variable Symmetric Multiprocessing],四个主核心的工作频率最高1.4GHz[单个核心1.4GHz,多核心1.3GHz],而除这四个主核心外,另外专门还有一个同样A9架构的低功耗设计的核心,它的主频被设定在最高500MHz,它被称为协核心[Companion Core]。协核心和主核心加在一起则达到5个Cortex-A9核心,我们根据NVIDIA提供的官方数据,来了解一下Tegra3的表现。

  • vSMP架构

    NVIDIA Tegra3的研发代号为Kal-EL,所以下面大量图表会以这个名字出现。在第一代Tegra中,我们就知道NVIDIA使用了一颗ARM7处理器作为低负载核心搭配Cortex-a8核心进行工作,而在包括待机、音乐播放等低负载工作中,各家处理器也有不同的方式。而Tegra3的vSMP让这个设计思路更进一步,“协核心”的出现是Tegra3的精髓所在。为了更好的控制能效,协核心同样采用Cortex-A9架构,但工艺设计上专门为低功耗低主频优化,它最高工作频率500MHz。而其他四个主核心架构与协核心一致,这四个核心单核心工作最高主频为1.4GHz、多核心工作时主频最高为1.3GHz。协核心与一个或多个主核心不能同时工作,处理器通过高效的管理办法可完成多核心间高速切换,官方给出数据是切换时间小于2毫秒。这么设计达到的目标是,在低负荷时只有协核心最高500MHz主频工作,能效比会明显高于主核心工作状态下的数值。如果需要更高的性能,此时四个主核心才会按需进行切换工作。

  • 为了保证Tegra3的高效率以及一个或多个主核心工作状态与协核心工作状态间无缝切换,在缓存、Android系统优化方面Tegra3也有特别之处。正如上文所说,低功耗的协核心与一个或多个主核心是不可以共同工作的。在一般使用时,例如打开视频或打开游戏时,Tegra3一定会切换到主核心工作状态,此时协核心是完全停止工作的。但要实现无缝衔接切换,在缓存设计上,主核心和协核心共享1MB的二级缓存,缓存间返回数据速度在纳秒级别。

    在Android系统下,虽然系统可以允许多个核心在不同频率下运行,但系统假设每个核心的运算能力是完全一致的,它会依次来分配计划任务,而此时显然多核心工作是不够高效的。而NVIDIA表示,vSMP将一直保持被激活的核心工作在同步系统频率上,以此方式为Android系统优化,从而达到更高的效率,NVIDIA还专门有关于负载平衡功能的视频演示,大家可以在国内视频网站搜索Tegra3关键字看到相关视频。

    vSMP Tegra3性能与功耗对比

    NVIDIA官方还展示了多套数据来说明Tegra3在功耗和性能方面的优势。首先看的图表是Tegra2和Tegra3在同样应用下的对比,两个处理器同样是来自台积电TSMC的40nm工艺制造。我们看到多个项目中,Tegra3功耗优势明显。

  • 而更为有价值的是一份《Coremark》的测试软件的结果,虽然我们不十分清楚这款测试软件具体测试方法和项目负载轻重,但结果却非常有趣,值得参考。从表格中看到,对比的处理器包括Tegra3四核心工作在480MHz、TI的OMAP4系列处理器工作在1GHz[双核心]、QC8660即Snapdragon MSM8660/8260工作在1.2GHz以及Tegra3工作于1GHz时的功耗和性能。我们看到,Tegra3四核心工作于较低频率时性能与目前TI和高通主流双核处理器相当,但功耗却只有它们的35%左右。而Tegra3的四核心工作于1GHz时,功耗仍要比TI OMAP4和MSM8660/8260低20%左右,性能却领先一倍。随后的多张图表,NVIDIA是想向大家表明很简单的道理。达到目前主流性能,Tegra3只需要付出一半的功耗,而如果需要更高的性能,Tegra3可以提升近一倍,而功耗却比现在双核心主流产品低20%。

  • 由于NVIDIA详细的功耗对比主要以这一款Benchmark软件为主,而且并没有告知该软件的测试方法、测试项目,但如果不出意外,它仍具有很高的参考性,Tegra3即便不考虑协核心的存在,它在多核心的优化上也明显优于目前的主流双核心ARM处理器。当然,这个测试中可能不包括3D图形单元部分的运算。

    加强的GeForce单元

  • 此次Tegra3的发布在图形性能方面同样有不少的相关展示,但对GeForce部分的加强则不是重点,在Tegra2处理器中8个核心单元[4个Vertex Shader和4个Pixel Shader]被增加至12个,在功能上图形输出支持HDMI 1.4a规范,支持3D视频播放和输出,支持通过Tegra3 2D转3D功能。同时,NVIDIA官方资料更多描述表示,目前的移动平台3D引擎可以很好的支持多核心处理器的工作,因此Tegra3的多核心会有相应的表现。从展示内容来看,我们看到更好的实时光影效果、动态模糊效果、以及物理引擎运算效果。但这些效果应该并不只是GeForce或者Tegra3独有。

    其他相关技术

    在其他周边技术方面,Tegra3也有很多项提升。它可支持3200万像素的主摄像头,全新的300M像素/秒的图形处理单元[性能提升一倍]。Tegra3还将支持DDR3-1500\LPDDR2-1066规范的内存接口,同时支持SATAII规范的存储接口。它支持7.1声道的音频输出。

    技术与前景分析

    对手的产品:在TI、高通、甚至ARM的白皮书中,2012年以后的产品发展方向已经与NVIDIA Tegra3有了不小的差别。在TI的计划中,OMAP4系列处理器会在2012年上半年推出同样架构更高主频的双核心产品,例如OMAP4470会达到1.5-1.8GHz的主频,图形单元PowerVR SGX544也将频率提升至384MHz。而TI的2012年下半年的OMAP5系列产品,是ARM公司Cortex-A15核心的产品,Cortex-A15的架构仍与A8、A9一样基于ARMv7架构,其思路和X86时代处理器的发展比较近似,将A9的流水线从8级增加到15级,配合28nm的制程,从而实现2GHz甚至更高频率。目前来看,TI并没有可以与Tegra3对应的产品。

    而在高通方面,他们也在10月份发布了Snapdragon S4[目前销售的为S3]、MSM8960系列,对于高通来说这是一次重要的升级,但我们知道Snapdragon S3一代的产品已经是落后于TI、NVIDIA等产品的,MSM8260仍然使用Cortex-A8核心,单纯依靠半导体制造工艺的改进,强行提升主频至1.2-1.5GHz,发热量和功耗都达到了惊人的地步。很难想象昔日Android平台最佳选择的高通芯片组,在Snapdragon S3一代做出这样的选择。而MSM8960终于采用Cortex-A9核心,计划发布日期也要在2012年第二季度左右,采用28nm工艺制造,双核心1.5GHz。为了提升主频,高通MSM8960将A9最低8级流水线长度加大到11级。显然,这与Tegra3也并不是可以对应的上的产品。

    当然,前面已经谈到,按照ARM公司的计划,他们已经准备好了Cortex-A15,这是2012年下半年的产品,相信NVIDIA也会有相关产品。

    vSMP和ARM的优势:Soomal虽然对Android手机接触的并不足够多,但我们在一些测试中发现了一些规律。大家也许知道,高通芯片组中MSM7230处理器,就是MSM8255处理器的低频率版本。一般MSM8255工作在1GHz,而MSM7230工作在800MHz,典型代表就是华为U8800和DesireZ手机。虽然只有200MHz的差别,但MSM7230处理器的功耗表现明显要好于MSM8255。反之,工作在1.5GHz的MSM8650[Snapdragon QSD8250同架构]功耗则要明显高于工作在1GHz的MSM8255[同样45nm工艺]。再来看高通MSM8260处理器,1.2GHz工作频率时功耗也要明显大于Cortex-A9架构的处理器。我们认为,无论ARM还是X86处理器,在同样工艺制程同样架构下,处理器有一定的频率工作范围,但他们也有最优的工作频率。从Tegra3的测试、MSM7230的表现来看以及多年来ARM的表现来看,自从ARM处理器跨上“GHz”平台后,低功耗的英名就变得不复存在了。40nm工艺制程的Tegra3的四核心,500MHz以下的工作频率就可以实现与目前主流1GHz双核同样的性能,而功耗却只有他们的35%左右。ARM是否真的更适合工作在较低的主频呢?Cortex-A15 加大流水线级数,将主频拉升至2GHz的做法,会不会重蹈Intel Netburst覆辙呢?

    应用需求仍不明朗:此次Tegra3的展示中有不少惊艳的游戏画面,但此次Tegra3的GeFoce单元并没有明显升级,这些画面的提升应该更多的与游戏开发有关,当然也与足够强大的处理器能够应付这些光影、材质、物理运算和AI运算有关。但10多年来,PC平台3D游戏应用的发展仍近在眼前。如果不是id Software的Quake 3在GeForce 256上压倒性的优势,以及DirectX 6、7的巨大成功,3dfx也许就不会倒下。当然,我们上面只是一个侧面唤起大家的记忆,GPU的成功也不仅仅是依靠一两款游戏。但Android平台和Tegra平台上,仍然看不到这样的游戏作品出现。

    今年NVIDIA的Tegra Zone对Android平板高清晰度游戏的推动有很大的作用,但一方面Tegra Zone中的游戏大作并不多,我们并不是说Android平台没有游戏大作,但这些游戏大作并不是Tegra Zone主推游戏。无论赛车、第一视角设计、网络农场类游戏没有一个可以扮演当年Quake 3的角色。这个局面并不奇怪,即便在iOS平台上,极为精美的《RealRacing 2》、具有丰富历史人气的《街霸4》已经取得了非常好的成绩,但他们与销售排行榜单领先者的差距还是非常巨大的。在平板电脑上,游戏性和独特的体验方式是目前看来最为重要的。画面精美并不是不重要,但至少时机未到。

    Windows 8的到来:Tegra平台一直是微软热爱的“实验平台”,以至于仅仅为了做一个Metro界面,就去推出ZuneHD播放器,然后销量不佳果断停产,而它用的就是Tegra第一代产品。微软多次展示Windows 8的ARM版本,而使用的就是NVIDIA的Tegra2。在2011年,Motorola、三星等品牌的平板电脑,分别放弃了自己的合作伙伴TI和自家的处理器,而选用Tegra2,想必Tegra3处理器他们没有理由拒绝。而htc也宣布,新款的平板电脑会使用Tegra3处理器。华硕的平板更是与Tegra3同时发布。这一方面与Tegra的良好表现有关,相信与2012年的Windows 8的到来也有很大关系。NVIDIA在Tegra3发布时甚至表示,Tegra3不仅适用于我们目前看到的平板电脑,他们会推出不同封装、不同功耗标准的型号适应不同设备。或许是消费电子、或许是笔记本。

    请评分
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    120.033.***.***
    120.033.***.***
    44
    202.108.128.***
    202.108.128.***
    发表于2013.06.16 19:50:20
    43
    03
    没有当年INTEL的不授权哪有今天的NV! 老黄的决策牛逼,大方向指的好啊。
    AMD反应慢,后知后觉。等到收购了AIT提升了GPU实力后,再想T走NV。却发现NV早就转移了方向。
    顺带一提的是,NV科学运算那一步走的也同样牛逼!
    发表于2012.05.16 18:38:19
    42
    03
    不过图形部分变化太小,干过543MP4的希望渺茫,估计这就是索尼不要T3,转而自研PS VITA处理器的原因。
    发表于2011.12.20 11:32:23
    41
    114.238.149.***
    114.238.149.***
    发表于2011.11.26 22:44:12
    40
    03
    对GPU部分失望啊,今天看到NV不知道在哪的分公司说是测试方法不对,强词夺理。
    发表于2011.11.24 23:23:54
    39
    123.127.211.***
    123.127.211.***
    发表于2011.11.24 17:27:36
    38
    218.014.228.***
    218.014.228.***
    发表于2011.11.18 00:19:29
    36
    03
    发表于2011.11.16 16:38:16
    34
    180.169.***.***
    180.169.***.***
    因为Tegra不包含完整的适用于手机的系统。没有用于接收/发送手机信号的模块。如果要外接这样的模块,不仅手机厂商的开发成本大增,而且手机功耗和稳定性也难以控制。
    发表于2011.11.16 13:27:56
    31
    一路走好
    发表于2011.11.16 09:45:56
    29
    124.160.034.***
    124.160.034.***
    发表于2011.11.16 00:11:17
    28
    222.064.***.***
    222.064.***.***
    集成了这么核心成本是一个问题
    发表于2011.11.15 22:28:02
    27
    03
    再好的硬件也需要软件的配合,希望老黄能搞定哪些人。
    发表于2011.11.15 21:34:58
    26
    03
    发表于2011.11.15 21:24:48
    25
    提示
    本贴不可匿名回复,回复等级为:1 ,您现在正处在潜水状态
    回复
    验证码
    9951 为防止广告机贴垃圾,不得已而为之
    表情
    正文