- 2013-6-14 23:41:21
- 类型:原创
- 来源:电脑报
- 报纸编辑:薛昱
- 作者:
得益于智能手机与平板电脑的蓬勃发展, ARM发展势头强劲,为了维持低功耗高性能的优势,其处理器架构也在不断更新。在不久前举行的Computex2013上,ARM推出了定位中端市场的Cortex-A12架构,用来接替现有的 Cortex-A9架构。ARM为什么要发布这个原本不在计划之内的架构,Cortex-A12又有什么过人之处呢?
出人意料的发布
在Cortex-A12发布之前,关于他的信息非常的少,以至于现在让人觉得有些非常惊喜的感觉。那么ARM在今年推出Cortex-A12意欲何为呢?简单来说,其实这一切都是适应市场发展的需要。
ARM针对2010年到2015年在智能移动设备出货量的统计与预测图表
ARM的原计划是,高端市场由高性能的Cortex-A15架构处理器把持,而Cortex-A7 架构处理器则控制着入门级市场。两个架构均是采用了经过细致调试的8级简单顺序执行流水线,拥有低功耗高性能的特点,在同尺寸处理器中拥有明显的优势。在中端市场上,继续让Cortex-A9架构发挥余热,以“两新一旧”的组合安心过日子。
但是中端移动设备市场正在快速发展,根据ARM自己的预测,到2015年,200美元~300美元价格段的中端手持设备出货量增幅较大,达到5.6亿台,中端市场是完全无法被忽视的。再加上以英特尔为首的X86阵营对移动设备领域虎视眈眈,一心想将X86处理器推广到移动市场,SoC化并大幅降低功耗的ATOM以及Bobcat,企图已经相当明显。而且市面上的X86处理器手机目前主要针对的也是中端用户。在PC业芯片大佬“捞过界”及中端市场快速发展的双重压力下,尽管Cortex-A9架构非常优秀,但是在技术上已经算不上先进,已然是越来越力不从心。
在这种情况下,Cortex-A12架构诞生了。这是一款面向中端市场推出的处理器核心,其市场定位与当前的Cortex-A9基本保持一致,介于高端核心Cortex-A15和低端核心Cortex-A7之间。如果用一句话来形容Cortex-A12,那么这将会是一款拥有中端性能表现,中等核心尺寸以及中等功耗表现的处理器核心,因此也可以将其视作Cortex-A9的接班人。采用Cortex-A12架构的处理器将在2014年上市,而且联发科、威盛及其子公司威睿、美商迈威尔在第一时间获得了授权。
Cortex-A12架构:缩小版Cortex-A15
Cortex-A12是Cortex-A9的继任者,但是这两者却没有任何的继承关系,Cortex-A12采用的是与Cortex-A9截然不同的设计。从架构本身而言,Cortex-A12更像Cortex-A15的缩小版,最为显著的一点就是Cortex-A12采用与Cortex-A15一样的乱序执行架构。
Cortex-A9核心架构
Cortex-A12核心架构
Mali-T622 GPU架构
乱序执行是相对于顺序执行而言的。顺序执行是让一个线程中的各个指令根据其原有顺序逐一执行,这样芯片内部就完全无需加入用于指令分析和运算结果合成的逻辑。顺序执行架构最怕遇到的情况就是执行一条高延迟的指令时所需要的数据迟迟未被送到缓存中来,这时执行单元就必须一直处于空闲等待的状态中,这会大大降低效率。而所谓乱序执行技术就是允许指令按照不同于程序中指定的顺序发送给执行部件的一套方法,通过把不能立刻执行的指令搁置在一边而把能立刻执行的后续指令提前处理,这样可以提高执行效率。在乱序执行这种结构下,CPU可以更灵活地安排指令,不必因为等待读取内存信息而浪费时间,而代价则是核心功耗和尺寸的增加。Cortex-A12的核心完全是乱序执行架构,最立竿见影的效果就是性能的提升。
除此之外, Cortex-A12的管线整数运算流水级达到了12级,比起Cortex-A9的9级长,相应的频率也会更高。再加上Cortex-A12改进了管线整数运算流水级每级之间的电路功耗,使得在分支预测失误时,损失的命令数也减少了,所以整体性能也得到了明显的提升。工艺上,Cortex-A12最初会使用TSMC 28nm HPM工艺,之后会升级为20nm工艺,因此在Cortex-A12芯片大小、功耗上面都比会采用 40nm 制程的 Cortex-A9 来得更好。
Cortex-A12的指令集仍然与Cortex-A15差不多,主要为ARMv7A指令集支持,以及40-bit寻址空间和大物理地址扩展等。同时,Cortex-A12的指令宽度从Cortex-A9的64bit大幅度提升到128bit,指令分派方面可以支持8条指令分派,相比之下Cortex-A9只能支持4条。指令效率方面,由于Cortex-A9的分派端口比较少,可能出现浮点指令拥堵的情况。Cortex-A12为浮点处理器和协处理器单元分别设置了指令分派单元,因此这方面的效率也会有比较明显的提高。不过Cortex-A12依然为双指令解码,而Cortex-A15为三指令解码。即便如此,根据ARM的官方数据,Cortex-A12的单线程性能要比A9有40%的提升。
此外,ARM 还对 Cortex-A12 处理器进行了特别的设计,使其能够与高性能、低功耗的 ARM CoreLink系统 IP 系列辅助组件高效协作。为轻松实现 1080p 编码/解码的 1080p 30 帧图形输出,该系统还配备了支持 OpenGL/ES 3.0 的 Mali-T622 图形处理器 和 Mali-V500 视频加速器。CoreLink CCI-400 高速缓存一致性互联提供了带 Mali 的 I/O 一致性通道,从而为任务的减负和加速增添了一系列令人兴奋的可能性。
兼容big.LITTLE,中端用户难买账
相对于Cortex-A9,Cortex-A12另一个新增特性是支持big.LITTLE技术。我们都知道所谓的big.LITTLE技术,就是高性能的big-Core核心与尺寸小同时功耗更低的LITTLE-Core核心的结合。
big.LITTLE的第一个组合版本是用Cortex-A15 和Cortex-A7 处理器进行组合,让系统在低负载时由 Cortex-A7 处理核心负责执行,等到游戏等高运算需求时可瞬间切换到高性能的 Cortex-A15 核心,从而实现高性能和低功耗的兼顾。由于big.LITTLE是通过软件层面来实现CPU核心的切换,因此两个处理器核心部分的命令和运行模式需要相互兼容。由于之前的Cortex-A9与Cortex-A7/A15不能兼容,因此无法构成big.LITTLE。
Cortex-A12构成big.LITTLE系统效果图
将Cortex-A12处理器与Cortex-A7处理构成big.LITTLE系统,这个想法看上去很好,但是问题非常明显。由于Cortex-A15的功耗太高,所以ARM才推出big.LITTLE技术,在处理低负荷应用时可以使用功耗很低的Cortex-A7,以延长续航时间。不过Cortex-A12与Cortex-A7的性能差距相对较小,那么big.LITTLE的实用性会降低,再加上多颗处理器增加的成本,被中端用户所接受的可能性并不大。
为手机加把锁
现在手机的功能是如此的强大,安全性是不得不提的。Cortex-A12加入了TrustZone安全技术。TrustZone是ARM为了方便软硬接口的设计,以及避免系统受到恶意攻击所推出的一套安全措施。
TrustZone有两种工作模式,一种是正常模式,可以执行正常执行各种操作;另一种模式就是安全模式,只能执行受信任的指令。这两种模式都是集成在一个内核中的,很容易让人联想起类似Intel HT超线程技术,实际上TrustZone并不是双线程并行的,它只有一个线程,只是根据不同的需要在两种模式中简单切换而已。利用这一技术,开发者就能为使用Cortex-A12处理器的设备设计出安全系数更高的安全防护机制,相当于给手机加上了一把锁。
采用Cortex-A12架构核心的处理器结构
延伸阅读:目前ARM的主力架构
Cortex-A9:2009年发布,在Cortex-A8的基础上做了大量的改进演变而来。最大的特点是是采用双内核设计,采用能在每个循环中执行四条指令的乱序执行,性能有了明显的提升。但是功耗确实也有提升,这促使Cortex-A9架构的处理器采用比较先进的工艺,以降低功耗。。Cortex-A9还采用MPCore 技术,可将核心扩展为4个,正是有了这个特性,所以我们才能见到首款双核处理器Tegra2推出不到半年,四核的Tegra3的接踵而至了。
Cortex-A15:2010年发布的针对高性能运算推出的架构,为四核心设计。每个核心拥有3个指令解码单元,指令解码能提瞬间提升了1/3。在浮点运算方面,使用了2个浮点处理器和2个协处理器单元,性能比Cortex-A9提升了一倍。
Cortex-A7:这款2011年发布的架构在体系结构和功能集方面与 Cortex-A15完全相同,但只支持顺序执行,在并行计算中只能顺序执行两条指令。不过其采用了相比Cortex-A8更先进的预测器,使得分支预测计算能力得到提升的同时,这颗芯片更为节能。而且A7很“迷你”,28nm的单核Cortex-A7的面积仅有0.5平方毫米。
 报纸客服电话:4006677866 报纸客服信箱:pcw-advice@vip.sin*.c*m 友情链接与合作:987349267(QQ) 广告与活动:675009(QQ) 网站联系信箱:cpcw@cpcwi.com
Copyright © 2006-2011 电脑报官方网站 版权所有 渝ICP备10009040号