英特尔的研究成果一直以来都是行业的标杆,预示着5~10年甚至更久远的科技发展行径。英特尔研究院是英特尔公司的“科技创新引擎”,而英特尔中国研究院是英特尔全球科研体系的重要一环,并深度融入中国创新体系,搭建政产学研多方合作的新型研究网络,主攻人工智能、边缘计算、敏捷设计三大研发方向。
在一年一度的英特尔中国研究院探索创新日上,英特尔中国研究院又公布了一系列前瞻性研究项目和创新成果。
提升推理速度和维度的两大技术
● 亚比特神经网络技术
为提升人工智能推理速度,英特尔中国研究院前瞻性地提出亚比特神经网络技术,从统计意义上实现<1bit DNN量化,实现显著压缩/加速比。
据英特尔研究院副总裁、英特尔中国研究院院长宋继强介绍,神经网络的参数包括权重和激活两个参数。最开始学术界神经网络设计为浮点型以保持最大训练和收敛精度,而后在应用中,由于32位浮点运算十分消耗计算资源和存储资源,尤其是边缘计算和终端IoT设备时消耗量会更大,由此引发业界的神经网络量化优化热潮:将浮点参数改为定点,浮点运算改为定点运算能够减少硬件消耗。
定点采用比特数来表示精度,比特数越高表示精度动态范围越大。在传统32位定点基础上继续下压至16比特、8比特、4比特、2比特、1比特,业界通常认为1比特表示一个参数已是最小,也成为了业界的思维定式。
英特尔中国研究院研究员发现1比特后是可以继续突破的,即亚比特。亚比特神经网络技术属范式转换,并非直接用比特来表示值,而是将常用卷积核筛选后索引,即统计分布描述。举个例子来讲,就等于是把原来9比特才能表示的东西,变为5比特。
在FPGA的实际部署中,亚比特神经网络加速器能实现更快的推理速度,这项技术能够赋予FPGA定制优化的机会。
● 全维度动态卷积
英特尔中国研究院提出了一种创新型动态卷积设计ODConv,该设计采用具有并行策略的多维注意力机制沿核空间的四个维度学习互补性注意力,以“即插即用”的方式替代常规卷积,能显著提升大型及轻量型主流CNN模型的识别准确率。
这种全尺度深度视觉学习技术能欧突破AI扩展瓶颈,实现更高推理准确率。部分研究成果已发表于NeurIPS、ICLR等AI顶级会议,并获批十多项专利申请。ODConv系列模型将于今年下半年在英特尔研究院开源项目中正式发布。
三大核心能力的边缘计算系统
数据爆发时代,众多数据、技术和商业模式汇聚到边缘,边缘计算重要性日益凸显。但当下,越来越多的企业机构正面临着延迟、带宽、安全性和连接性等数据处理方面的现实挑战。
针对当下及未来边缘应用的挑战,英特尔中国研究院原创的高可靠分布式边缘计算系统,前瞻性地提供三大核心能力:第一,有效的高通量实时分布式计算,在指定的、以毫秒为单位计量的时间内可靠完成;第二,对核心敏感数据(图像、视频、核心业务流等)精确的控制与共享访问;第三,高效提升边缘计算新业务的开发效率。
这些能力让边缘计算平台上的软件系统开发、迭代及部署与云计算相比更加快捷,能大幅提升业务面市速度。
现场,英特尔中国研究院分享在智能交通、教育及机器人等应用场景下,边缘计算的典型用例:智能交通方面,实现对来自摄像头、雷达、激光雷达等传感器的海量数据进行全天候、实时的数据融合分析,在100毫秒内完成复杂场景下的交通风险预判;教育方面,展示了“迎接未来教育,共创智能实验”的教学工具平台,基于人工智能算法,借助英特尔OpenVINO工具套件,实现端到端实时智能实验教学辅助;机器人方面,将边缘计算引入机器人系统,让其具备低功耗、小尺寸和高智能的能力。
“英特尔中国研究院在做智能边缘研究时,考虑的是解决现有算力需求大、碎片化等问题。”宋继强表示,此次展示的用例实际上是很弱的智能边缘,能力有限,如果考虑未来用在智能制造、智能城市、智能交通、车路协同、港口、矿山等领域,对数据处理量和实时要求会更高。这些要求能力较高的边缘领域会面临升级难、成本高的问题。“在未来,边缘市场容量非常大,相关分析认为边缘市场容量比云市场高几倍,其中一部分能够运用现有云原生系统,一部分则需定制,定制部分现在会有很多创发展。”宋继强如是说。
积极拥抱RISC-V指令集
英特尔作为x86架构的代表,正在积极拥抱RISC-V架构,标志性事件是加入RISC-V联盟。RISC-V开源领域活跃很多年的指令集,加之开源生态广受关注。
“英特尔中国研究院在两年前就开始在这个领域开展工作。”宋继强介绍道,英特尔中国研究院下设RISC-V敏捷设计实验室,进行设计可定制化RISC-V处理器和加速器IP,建立软硬件协同设计的仿真框架,支持迭代式开发和验证,利用先进的设计语言和工具,大幅度提升领域专用芯片设计和验证效率。
领域专用SoC是提高特定领域应用性能和效率的关键,但更复杂的设计、更长的验证时间及更快的商用需求,让传统的设计和验证变得更具挑战性。RISC-V技术提供开放的、模块化、可定制的指令集,适合特定领域(Domain Specific Acceleration,DSA)芯片所需的灵活性和高效能,并且越来越多的DSA设计开始选择使用基于RISC-V的指令集。
现场,英特尔中国研究院展示RISC-V在敏捷开发领域研发取得的进展:将CPU功能模型、SoC功能模型广泛地应用到处理器和DSA的研发流程中;将可综合高级设计语言进一步应用到IP设计和SoC中,提高了设计效率;FPGA仿真平台应用加快英特尔的验证和软件测试。
宋继强强调:“RISC-V有一个很大的好处,它定义时已经很模块化了,目的就是为了增加复用性,行业不同模块互相组合在一起不会产生违和感,虽然实现形式不同,但在接口层面能够互相连接。”
基于RISC-V指令集的敏捷开发流程能通过软件方法快速描述新硬件模块,通过软件功能模型、性能模型早期整合,在硬件测试芯片未诞生前就进行大量的滚动验证,这就是敏捷开发。英特尔中国研究院从高层语言开始指令集优化设计、功能模块设计。这部分与学术界、产业界的生态基本同步,研究院也会参与到一些领域的开放合作中。
总结
面对新概念、新技术、新应用的不断涌现,英特尔中国研究院坚持‘创新领域探索’与‘规模化商业化导向’的‘双轮驱动’策略,并针对中国庞大的市场数据及复杂的应用场景,结合自身技术优势与本土应用,制定更为长期的本地化发展策略,融合国内外先进技术促进可持续创新。
此次活动中,英特尔中国研究院搭建了新型研究网络,联合政产学研多方,在技术方向、人才培养和成果孵化上共同合作,实现与客户、合作伙伴协同创新,共赢未来:英特尔中国研究院宣布与首都医科大学附属北京朝阳医院达成战略合作协议,基于英特尔中国研究院提供的新型传感技术、交互技术及CPU、GPU、AI和FPGA等计算平台,共同打造急诊危重症医学的“连续性医疗体系”,构建数字化医疗新生态;同时宣布与南京市麒麟科技创新园合作,联合成立英特尔智能边缘计算联合研究院,携手加速智能边缘计算的技术创新及应用落地。
作者丨付斌