去年,手游市场创造了超过920亿美元的收入,移动应用则创造了超过4300亿美元的营收,而移动数据使用量仍在持续攀升,全球每个用户平均每月流量预计将达到19GB。
设备创新以惊人的速度加速发展的同时,基于Arm架构、为Arm架构应用进行开发的开发者也越来越多。
每年,Arm全面计算解决方案都会为智能手机带来全方位的升级,今年,也不例外。Arm 2023全面计算解决方案(Arm TCS23)涵盖了首屈一指的全新旗舰级Arm Immortalis GPU,还提供了全新的Armv9 CPU集群,包括Cortex-X4、Cortex-A720、Cortex-A520。
第五代GPU架构首款产品Immortalis-G720
去年,Arm推出了基于第四代Valhall架构的Arm Immortalis,将安卓手游体验推至全新的高度。
全新的Arm第五代GPU架构在设计之初,便兼顾了CPU和系统,该架构重新定义了部分图形管道,显著减少了内存带宽,从而让总体系统效率与功耗优化高达14%。在相同的功率预算下,第五代GPU架构能够实现更出色的视觉效果,或在节省功耗的情况下,提供更持久的沉浸式移动体验。
第五代GPU架构中引入了延迟顶点着色(DVS),重新定义了GPU中的图形数据流,并将成为未来图形和几何复杂工作负载的关键,有助于扩展内核数量,并在未来达到更高的性能水平。
对游戏玩家来说,第五代GPU架构能够实现更高帧率和经优化的高动态范围成像技术HDR获得更逼真的体验,对建筑师来说,可在现场直接通过建筑物实时3D效果图将计算机辅助设计CAD规划变为现实。
首款基于第五代架构的GPU产品Immortalis-G720则是专为旗舰智能手机而设计,拥有15%的性能提升,减少了多达40%的内存带宽用量。它是目前Arm能效最优的GPU,在相同配置下,相较于前一代产品,Immortalis-G720性能提高了15%,而面积仅增加2%,而其前一代产品已证实在面积效率方面胜出相近竞品高达20%。
Armv9 Cortex 计算集群连续三年实现两位数提升
超大核Cortex-X4方面,相比前一代产品(Cortex-X3),其性能提高了15%,同时可以显著降低功耗多达40%,而面积仅增加了10%,这是Cortex-X系列处理器中,在每平方毫米的性能方面最出类拔萃的产品。
大核Cortex-A720和小核Cortex-A520方面,与其上一代相比,均在能效方面提高了20%。Cortex-A720是业界主流的CPU IP,可提高持续性能,是新CPU集群的核心主力,Cortex-A520则是最出众的的高效性能核心。
此外,为了完善全新的CPU集群,Arm推出了全新DSU-120,能够满足高要求的多线程用例。
除了升级每个核心的能力,新的CPU集群提供更多的DSU电源模式,以支持更高效地使用更大的L3缓存,并减少外部DRAM流量,从而实现性能更佳、效率更高的SoC。
值得一提的是,今年早些时候,Arm已在TSMC N3E制程工艺上顺利完成业内首个Cortex-X4的流片,共同为类似Cortex-X4的Arm内核打造定制IP,为充分利用制程工艺和处理器带来的PPA优势做好准备。这项合作为未来奠定了基础,届时Arm将通过设计分区和利用先进的封装技术,一同协作提高系统性能和能效。
拥有无限想象力的全面计算战略
全球有近900万个移动开发者在基于Arm架构、且为Arm架构应用开发。而Arm的全面计算战略是通过一整套针对特定工作负载而设计和优化的IP,这些IP可作为一个完整的系统,无缝地协同工作。Arm始终站在技术前沿,通过不断提升硬件的机器学习功能,让开发者能充分利用AI和ML工作负载的优势。
以最新的智能手机平台举例,Arm CPU和GPU的性能提升带动了AI处理能力大约每两年便会翻一番,基于Arm架构的AI平台出货量远远超过其他终端计算架构,因而成为全球开发者在为其应用程序引入AI和ML时,最容易访问和锁定的平台。
例如,Arm的开源软件库Arm NN和Arm Compute Library可支持开发者在Armv9 CPU和Arm GPU上优化ML工作负载的执行。今年年初以来,Arm NN和Arm Compute Library已在安卓平台上面向Google Apps开放,目前拥有超一亿的日活用户。明年年初,这些Arm技术库将通过谷歌移动服务向第三方应用程序的安卓开发者开放访问。也就是说,每位安卓开发者都将能访问最新的Arm技术和软件更新,确保在Arm架构上获得出色的AI性能。
2023全面计算解决方案中,在新版CI-700中引入了许多创新技术,进一步缩小了芯片面积,将互连产生的延迟降低了25%,同时优化了空闲电源,在不影响电池续航时间的前提下,能够实现杰出的系统性能表现。
除此之外,Arm迁移到64位系统的任务已经完成。根据Arm 中国区业务全球副总裁邹挺的介绍,去年Pixel 7推出了一款纯64位应用程序的操作系统,MediaTek也推出了第一款全64位的安卓SoC,另据中国主流应用商店近期报告称,在前3000款常用的应用中,纯64位系统应用的合规性接近百分之百。
Arm的内存标记扩展MTE功能,支持开发者在应用部署前后检测和避免内存安全漏洞,为用户提供功能安全及信息安全的数字体验。Arm v9架构CPU的MTE功能已努力消除占所有软件漏洞中70%的内存安全漏洞。邹挺为此举了几个例子:最近手机厂商荣耀宣布将向开发者提供支持MTE的设备,快手也将进一步借助该技术优化改进其开发流程,为3.6亿日活用户带来更好的用户体验。
最近一段时间内,大模型是讨论声量最大的领域。两周前,Google I/O大会重点强调其在考虑把生成式AI引入安卓生态系统,不久前,微软Build开发者大会也要将其引入Windows 11之中。
Arm高级副总裁兼终端事业部总经理Chris Bergey表示,Arm也正通过相关工作以确保AI 可以很好地在 Arm架构上运行。他强调,未来将是混合(hybrid)的环境,大型语言模型在云端运行,但考虑到智能手机或其他计算设备上本地运行AI的隐私和能源效率等问题,用户可以更愿意在设备本机上运行较小的模型。在Arm平台上,AI性能已经提高了两倍,Arm将继续推进对Arm NN和Arm Compute Library的支持,以便以Arm为目标的开发者能够继续利用类似ChatGPT或大型语言模型的应用程序来开发他们的应用。
文/付斌