去年2月15日,是英特尔技术老兵帕特·基辛格(Pat Gelsinger)回归担任新任CEO的那一天。时隔一年,在这位技术老兵的带领下,英特尔发生翻天覆地的变化。
打开英特尔的格局
IDM是芯片行业基础模式,也一直主导着行业。但在代工业不断“围剿”传统IDM之下,经历多年风霜的IDM也需要新的进化。
英特尔作为老牌IDM厂商,拥有CPU、独立GPU、FPGA、加速器四种主流芯片,还拥有架构、设计、软件、封装、测试、制造全部硅技术能力,但这种IDM是较为闭塞的。
帕特·基辛格上任第一件事就是宣布“IDM 2.0”战略,这一战略主要用意是将IDM模式的格局打开。
IDM 2.0由三个关键部分组成:第一,英特尔面向大规模制造的全球化内部工厂能够实现不断优化的产品、更高经济效益和更具韧性的供货能力;第二,扩大采用外部代工厂;第三,提供英特尔代工服务(IFS)。自从战略被提出,成为这一年英特尔的主要推进目标。
在产能方面:2021年3月,计划投资200亿美元在美国亚利桑那州的Octillo园区新建两座晶圆厂;2021年5月,计划投资35亿美元对美国新墨西哥州的Rio Rancho晶圆厂进行升级,不仅能够扩大差能还能承接第三方代工业务;2021年6月,宣布与供应商合作,在越南工厂完成芯片基板的生产,并完成基板增产;2022年1月,投资200多亿美元在俄亥俄州建设两个新的尖端芯片工厂。
在代工方面:2021年7月,宣布IFS首个客户AWS,并预告高通将与Intel 20A制程工艺合作;提出收购Si-Five并在今年2月7日加入RISC-V国际基金会,至此英特尔代工是唯一一家能为业界提供x86、Arm和RISC-V三种领先的指令集架构(ISA)的代工厂;今年2月8日,英特尔设立10亿美元基金建立代工创新生态系统;今年2月15日,开放x86内核授权。
终结“纳米数字游戏”的“猫腻”
纳米制程节点是衡量工艺演进的重要数字,看似毫无无规律的数字背后隐含的是摩尔定律划分的晶体管栅极最小线宽。但在当初每两年翻一番的摩尔定律,早在1997年就出现栅极长度/半截距与节点名称不匹配的情况。在纳米数字越来越逼近1nm的时代,行业需要更加科学的衡量标准。
2021年7月,帕特·基辛格宣布将以每瓦性能作为关键指标衡量工艺节点的演进,即PPA(Performance、Power and Area,性能、功耗、面积)。按照PPA的方式测量关键节点,不仅能够更加科学地衡量产品性能,也能将节点切分更加精细。
Intel 10nm SuperFin将是英特尔最后使用传统纳米制程的节点,目前已在至强Ice Lake和Agilex FPGA中采用,此后发布的12代酷睿Alder Lake便以Intel 7为全新命名,根据PPA特性,此后将会拥有Intel 4、Intel 3、Intel 20A、Intel 18A等新制程节点。
需要注意的是,英特尔彼时表示将会定义、构建和部署下一代High-NA EUV,确保在制程上取得突破性成功,超越当前一代EUV。今年1月这一承诺被实现:英特尔率先以3.4亿美金(约合人民币21.56亿元)订购ASML(阿斯麦)最新款机种TWINSCAN EXE:5200极紫外(EUV)光刻机。
扩大封装上的优势
实际上,封装对制程的影响非常深远,英特尔一直洞察到这种关系,在很久以前就将六大支柱中制程与封装合并为一体。英特尔的封装技术一直都是行业中强势的,而在去年一年英特尔则一直在扩大这种优势。
2.5D封装方面,不仅在Sapphire Rapids服务器CPU上首次采用EMIB(嵌入式多芯片互连桥接),还宣告下一代EMIB的凸点间距将从55微米缩短至45微米。
3D封装方面,Foveros将会开创下一代FoverosOmni技术以及对Foveros Omni的补充技术Foveros Direct。Foveros Omni允许裸片分解,将不同晶圆制程节点的多个顶片与多个基片混合搭配,通过高性能3D堆叠技术为裸片到裸片的互连和模块化设计提供无限制的灵活性。Foveros Direct则实现向直接铜对铜键合的转变,可实现低电阻互连,并使得从晶圆制成到封装开始,两者之间的界限不再那么截然。
开启E核和P核时代
俗话说“大小搭配,干活不累”,此前业界就有“大小核”架构形式,英特尔则在2021年8月的Alder Lake发布会上同时宣布了能效核(E-Core)和性能核(P-Core)的全新x86架构。为了提升综合性能(PerformanceHybrid),还一并发布了硬件线程调度器(Intel Thread Director),用来协同E-Core和P-Core工作。
E-Core优先考虑能效I/O的吞吐量,能够提高处理多种任务,同时保证比较好的功耗,适用于移动笔记本到台式机不同配置不同产品;P-Core是目前英特尔性能最高的一个内核架构,与此同时需要一些专门加速硬件配合,该核目标是针对计算密度较大场景。
这种全新设计使得PPA的提升又多了一个维度,通过按需分配负载让性能和功耗正确分配到所需应用之上,能够让架构发挥最大的能力。
将英特尔力量拧成一股绳
一年来,英特尔已经逐步打好“超异构计算”的牌,旨在将自己拥有的计算能力全部凝聚在一起。此前,宋继强曾向笔者介绍,英特尔的异构计算拥有两种方式,一种是芯片级集成方式,利用英特尔的Chiplet(小芯片)和封装技术将CPU IP、GPU IP、DSP IP等集成到单芯片内;另一种为板级集成方式,即将CPU、GPU、FPGA和加速器放在一个板上打组合拳。
在2021年9月,帕特·基辛格宣布英特尔的“四大超级技术力量”,包括无处不在的计算、无所不在的连接、从云到边缘的基础设和人工智能,由此针对物联网上进行集中力量操控。
在2021年10月,帕特·基辛格宣布英特尔“软件优先”的方案,并说:“我在11 年‘假期’中在VMware和EMC学到的一件事就是:如果提供软件不支持的芯片,必然是个错误。”oneAPI就是连接一切硬件的载体,而借由此平台发挥的力量便是一体化的软件和硬件协同。
面向未来的目标
英特尔2022年投资者大会,也是帕特·基辛格出任CEO的一年纪念日,这一次他将线再次放长,指出近几年的目标。
•英特尔至强:2024年进入Intel 3时代
英特尔计划在2022年第一季度交付Intel 7制程工艺的Sapphire Rapids处理器,仅在AI方面即可实现高达30倍的性能提升;计划2023年推出采用Intel 7制程工艺的Emerald Rapids;计划在2024年推出采用Intel 3制程工艺的能效核至强处理器Sierra Forest;计划在2024年将Granite Rapids的制程工艺从Intel 4 提升至Intel 3,这款下一代性能核至强处理器产品将于2024年问世。
实际上,从上述路线来看,Intel 4存在感较弱。英特尔对此解释是基于对Intel 3制程工艺的信心,直接在下一代产品Sierra Forest中使用Intel 3,一举成为“跳级生”。另外,P-core和E-core也将在至强新战略下双轨同时推进。
•客户端产品:Intel 20A和外部代工齐驱并驾
英特尔预计2022年下半年上市采用Intel 7制程工艺及高性能混合架构的Raptor Lake,Raptor Lake配置将升级至最多24核心及32线程,与Alder Lake相比将带来2位数的性能提升与更强的超频功能;2023年推出采用Intel 4制程工艺的Meteor Lake,2024年上市首个采用Intel 20A的Arrow Lake,二者都将启动外部代工,并将融合人工智能及独立显卡级性能的图形显卡晶片;为推进IDM 2.0战略,英特尔将同时采用内部及外部制程节点,研发Lunar Lake及更多产品。
•独立显卡产品:2022年全部上市
英特尔计划在2022年出货超400万颗的独立GPU,2022年第二季度将出货台式独立显卡,2022年第三季度出货工作站独立显卡,同时OEM厂商将于2022年第一季度发布配置英特尔锐炫显卡(代号Alchemist)的笔记本电脑;2022年稍晚时间上线Endgame项目,通过该项目服务,用户能够直接读取英特尔锐炫显卡信息,获得随时访问且低时延的计算体验。
•超级计算产品:全方位新能力
加速计算系统与图形事业部制定了到2027年实现Z级计算的技术路线,并通过全方位产品迭代实现这种计算能力:Sapphire Rapids将内置高带宽内存(HBM),能为应用程序提供多达4倍的内存带宽,实现高达2.8倍的性能提升;今年晚些时候将为Aurora超级计算机项目交付Ponte Vecchio GPU,该产品拥有优于市场领先解决方案2.6倍的性能表现;英特尔首款配备硬件AV1编码器的GPU Arctic Sound-M预计将于2022年年中出货;将x86与Xe 显卡集成在同一插槽的全新架构的Falcon Shores将在2024年面世。
•英特尔代工服务:酝酿汽车代工
目前,英特尔代工服务(IFS)正在组建一个专门的汽车团队,为汽车制造商提供完整的解决方案,重点关注三个方面:一、开放的中央计算架构,该架构将利用基于芯粒(chiplet-based)构建模块和先进封装技术,针对技术节点、算法、软件和应用的优化解决方案提供显著的灵活性,以满足下一代自动驾驶汽车的计算需求;二、汽车级代工平台,与Mobileye合作让IFS能够为汽车客户交付先进的制程技术;三、实现向先进技术的过渡,IFS将为汽车制造商提供设计服务和英特尔的IP。
•2025年在晶体管的每瓦性能上再度领先业界
制程方面,实现4年5个制程节点的跨越:预计2022年下半年投产采用极紫外光刻(EUV)技术的Intel 4,将晶体管每瓦性能将提高约20%;在2023年下半年投产Intel 3继续将每瓦性能上实现提升约18%;在2024上半年通过RibbonFET和PowerVia这两项技术进入Intel 20A,将每瓦性能上提升约15%的;在2024年下半年投产Intel 18A,将每瓦性能上提升约10%。
封装方面,实现先进封装技术的交付和投产:预计在Sapphire Rapids和Ponte Vecchio上交付领先的封装技术,并在Meteor Lake上试产;预计在2023年投产Foveros Omni和Foveros Direct。
如此众多的产品规划,处处透露帕特·基辛格这位技术“偏执狂”在技术迭代上的执著。据笔者了解,下一代至强处理器也曾计划使用Intel 4,如今却自信地计划直接使用Intel 3,这也印证了帕特·基辛格曾经说过的话:
“英特尔以前经历过领先和落后的周期。此前英特尔在多核上进度缓慢时,我曾参与其中,成功扭转了颓势,取得领导地位。伟大的公司可以从困难时期恢复出来,并且会比以往任何时候更强大。我曾受到格鲁夫训练,未来也将用格鲁夫的态度来推动执行”,帕特·基辛格表示,这也是他所推崇的“创始人精神”。
笔者了解到,2004年一位记者在采访帕特·基辛格时,每当他谈及技术,经常会使用“享受”这个词,这也足以证实这位老兵在技术上的执着。
2022投资者大会上,帕特·基辛格也为自己定了个“小目标”:在2026年实现双位数增长,预计到2030年将在单个设备中提供约一万亿个晶体管。
英特尔这一年很忙,从时至今日的路线来看,未来几年的技术路线探索和重回巅峰之路会更忙。