我们的生活离不开Arm架构。30年来,基于Arm架构的芯片出货量已超过2250亿颗。尤其是目前的手机,几乎均为Arm架构。
为了能够在手机上拥有更好的游戏体验,就需要更低的延迟、更好的画面效果和更少的手机发热。想要实现这些升级,底层的Arm架构至关重要。
Arm推出2022全面计算解决方案(TCS22),包括全新的CPU和GPU IP,将会帮助手机打造更好的游戏效果和更低的发热量。TCS22的Arm IP组合可在一系列工作负载中实现28%的性能提升,并可降低16%的能耗。
今年的重点是游戏应用
Arm的全面计算解决方案战略推出多年,旨在专注于计算性能、开发者对性能的可及性和平台的安全性。这在MediaTek(联发科)的天玑9000 SoC中已经得到了最佳的展现,它通过Armv9,作为最高性能智能手机的根基,被OPPO和vivo采用在其手机,带来无懈可击的领先持续性能。
据Paul Williamson介绍,全面计算解决方案专注于设计的可扩展性。Arm能通过GPU配置,满足广泛应用的需求。例如,可以使用少量的核心数来实现非常高效和紧凑的设计,也可使用大量的核心数来实现终极的视觉体验。在CPU集群中,可以采取类似的方法,针对每个应用采用不同的CPU并进行不同的配置。与此同时,Arm与合作伙伴紧密合作,让这些可扩展性形成不同的选择,并与专用计算相结合,从而助力合作伙伴加速打造面向目标用例的理想SoC(系统级芯片)。
Arm在全面计算中所采取的方法是综合广泛的基准评测和软件工作负载,多方面进行考量。每年,Arm都在扩大所考虑的工作负载的范围,而今年,Arm更多地关注于现实世界中游戏应用提升可持续性能的需求。对于能够在移动设备上长时间玩游戏的体验而言,持续的性能才是关键。
“如今,计算定义着我们日常体验,这些体验在不断变化。视觉的体验无处不在,无论是面向游戏还是生产率,智能手机是视觉体验的核心。开发者现在需要获取性能,以便丰富和释放他们的创造力。”Arm高级副总裁兼终端事业部总经理Paul Williamson表示, Arm的2022全面计算解决方案旨在定义未来的沉浸式3D视觉效果。
移动端是世上最大的游戏平台,移动游戏也是最大的游戏市场。随着相关性能与需求的增长,持续的性能表现成为游戏的关键指标。移动游戏非常强调性能极限,正是Arm能够在CPU和GPU上提供全面的优化,促成这项性能的提升。
手机将迎来硬件变革
在新产品上主要包括新CPU IP和GPU IP两部分。
CPU IP:超大核Cortex-X3,大核Cortex-A715,小核Cortex-A510。
Cortex-X3(超大核)属于Cortex-X的定制项目,目的是在推动峰值性能;Cortex-A715(大核)专注于为持续工作负载实现性能和效率的最佳平衡;Cortex-A510(小核)则聚焦于轻量型工作负载,主要是为高效率而设计。
Arm Cortex-X3与最新款的安卓旗舰智能手机和最新的主流笔记本电脑相比,其性能分别提升了25%和34%;Arm Cortex-A715与Cortex-A710相比,其能效提升了20%,且性能提升了5%,达到了可媲美Cortex-X1性能的重要里程碑;Arm Cortex-A510是Arm四年来推出的首款高效小核,今年更新版本在保持性能不变的同时,将功耗降低了5%。
目前手机SoC芯片普遍采用的是“1个超大核+3个大核+4个小核”的设计,这背后利用的是大小核 (big.LITTLE) 的配置,这也是目前全球消费级设备最常用的异构处理架构。
与去年的上一代产品相比,更新版的DSU-110所支持的CPU集群内核数增加了50%,实现了不同等级消费级设备的可扩展性。
GPU IP: Arm Immortalis,Mali-G715,Mali-G615。
Arm Immortalis是全新的旗舰GPU产品,它传承了全球出货量最高(超过80亿颗)的GPU产品Arm Mali的深厚技术积淀,并经过配置和增强,旨在提供终极的移动 3D 体验。值得一提的是,它将是首款可在移动端支持基于硬件的光线追踪的旗舰级GPU产品。Arm的光线追踪单元旨在为效率而打造,只占用了约4%的着色器核心面积,且仅耗费非常小幅的功耗,却能在相关领域带来300%的显著性能提升。Immortalis 将基于Arm可扩展的GPU架构配置提升到新高度,为终端用户带来最佳性能。
Mali-G715 GPU提供所有新款GPU均具备的可变速率着色 (Variable Rate Shading) 图形功能,能够显著降低能耗,并进一步提升游戏性能;Mali-G615将为更广大的开发者和消费者更快地带来高端的移动应用场景、功能和特性。
此次重点都放在了手机游戏上,视觉出色的AAA游戏必然少不了光线追踪这项技术,此次Arm的GPU开始支持硬件光线追踪,代表着新时代即将到来。
“ Arm最新产品将为旗舰和高端移动游戏设备带来前所未有的视觉体验。全新的 Immortalis GPU 具备硬件级别的光线追踪功能为开发者提供所需工具,以创建更加身临其境的沉浸式游戏体验。Immortalis GPU与性能强悍的Cortex-X3 CPU搭配,可实现顶级的移动游戏性能和更高的工作效率。” MediaTek副总经理暨无线通信事业部总经理徐敬全博士如是说。
全面计算的现在和未来
2022全面计算解决方案(TCS22)包括三项原则:
- 在性能上,持续推动手机64位设计。64位手机在过去一直处于犹豫不决的状态,而在近期OPPO、vivo和小米的中国金标联盟的成立,标志着中国计算生态系统和应用生态系统在64位上已全面就绪,未来几年的旗舰级智能手机都需保证为全64位设计,以确保获得最佳的效率及最强的性能。
- 在开发者可及性上,持续致力于Arm计算库和Arm NN框架。无论是GPU中的矩阵乘法的改善,还是系统级优化和设计中其他地方的缓存微调中,Arm NN和Arm计算库让开发者能获取这些性能。
- 在安全性上,将会提高处理内的安全性。Arm曾推出非对称内存标签扩展,它是Arm去年推出的同步MTE和异步MTE的结合。Arm将这项技术引入这一代设备上的可信执行环境中。比如人脸解锁和面部识别这样的功能,需要确保其免受额外的恶意攻击,这项技术就是关键。
全面计算是Arm对未来性能的承诺,同时Arm也在持续对这项解决方案增加投资。据介绍,在大核CPU产品线中有了Hunter和Chaberton两个新项目,在GPU产品线中有了Titan和 Krake两个新项目。另外,Arm也正投资于系统IP,以确保低延迟内存路径和系统级缓存性能,这将推动现实世界的持续性能及综合基准提升;持续致力于在设计中强化安全性,例如增加对隔离和虚拟化的支持,这与安卓的pKVM倡议保持一致。