前言:
随着数字化进程的推进,算力需求将越来越大,数据中心将逐步演变为计算中心,算力将成为新的生产力。而在智能革命风起云涌之际,让异构计算不断显露锋芒,并迅速站上了行业“C位”。
新型异构计算随技术提升
所谓异构,就是将CPU、DSP、GPU、ASIC、FPGA等不同制程架构、不同指令集、不同功能的计算单元,组合起来形成一个混合的计算系统。
在过去,随着半导体技术的进步和频率的提升,绝大多数计算机应用不需要结构性的变化,或者特定的硬件加速,即可不断提升性能。
但是现代应用经常会碰到内存、功耗方面的限制。
此时,引入特定单元、让计算系统变成混合结构就成了必然,每一种不同类型的计算单元都可以去执行自己最擅长的任务。
异构计算的本质,是为了解决一套系统中CPU、GPU、或其他什么计算组件性能“拖后腿”,或是负载过于不均匀的问题。
比如曾经APU本来是打算拿GPU弥补CPU算力的不足,比如高通最早搞异构计算,是想让手机发挥出更高的常规能效比,而现在则主要用于增强对于不同AI模型的兼容性和提高处理效率。
万物互联让传统计算架构与挑战
万物互联下,数据量已呈爆炸式增长。摄像头的出现让数据获取来源变得多样,加上日常使用的手机中有各式各样的传感器,让数据量变得更加庞大。
目前流行的AI中的深度学习,便是需要各式各样的数据进行机器学习,才能够让AI变得更聪明。
同样,人工智能模型里的数据被称为源数据,其需要的种类和数量基本来自第一边缘靠近数据产品的设备,例如无人驾驶数据,这类数据需要在边缘端上快速处理。
异构计算带来的好处之一便是它能够针对未来多种不同的应用快速给出高性价比的方案。
在万物互联的时代下,IoT设备像雨后春笋般大量被催生出来,多种设备的通用性要求不一,对性能、数据等方面都有独特的需求。
在这一情况下,需要异构计算,通过采用不同的芯片组合甚至不同的工艺来实现。
日常生活便有很多应用要求我们能够快速给出一些解决方案,而不是还要去重新定义一些芯片架构,重新做。
如果要又快又好去解决这一问题,异构计算是必需的,它能够将方案小型化,能把成本和效能达到一个不错的平衡。
传统的嵌入式系统已经无法满足需求,能够进行不同类型计算的异构计算便成为一个替代选择。

异构计算中心的需求加大
数据中心各业务间交换信息频繁,异构计算需求也相当旺盛,普遍存在的分布式系统以及分布式计算等特性导致了容错性、算力和扩展等性能问题,并且占比普遍较高。
在普遍存在的异构高性能计算机之间的软件互操作性、主存单边带宽和共享分区情况下,每秒处理200t数据和每秒处理8tb数据已成为当前最强劲的计算能力需求。
相对较长的计算驱动存储扩展需求,异构异构计算中心的需求又进一步加大。
FPGA加入“豪华套餐”
AI芯片主要分为CPU 、GPU、FPGA以及ASIC。其中以CPU、GPU、FPGA、ASIC的顺序,通用性逐渐减低,但运算效率逐步提高。
FPGA,即现场可编程门阵列,它是在PAL、GAL、CPLD等可编程器件癿基础上迕一步収展的产物。
未来人工智能应用场景对终端设备推断能力的要求高,FPGA是低功耗异构芯片,开发周期快,编程灵活,人工智能领域的解决方案目前正从软件演进到软件+芯片。
基于CPU的传统计算架构无法充分满足人工智能高性能并行计算需求,需要FPGA等人工智能架构的专属芯片。

异构计算时代的黄金搭档
在摩尔定律放缓,登纳德缩放比例定律和阿姆达尔定律接近瓶颈之下,摩尔甚至也曾给出“解药”,即“异构计算”,现在正是异构CPU与加速器的“黄金时代”。
数据中心已成为新型计算单元。在现代化、安全的加速数据中心中,DPU已成为其重要的组成部分。
CPU、GPU和DPU的结合,可构成完全可编程的单一AI计算单元,提供前所未有的安全性和算力。
在目前的技术条件下,英特尔的oneAPI的确可能是当今技术最先进,使用最方便,最有可能实现应用程序“异构计算”优化,从而带来执行效能飞跃的编程方案。

新基建提速重构
2020年,随着新基建的全面启动,全国各地的信创相关项目大面积铺开,信创产业发展持续提速,已成为一个备受关注的现象级风口。
其中,作为新基建和信创产业生态中的重要一环,信创数据库与芯片、操作系统并称为IT皇冠上的明珠,生态建设和产品成熟化持续加速,迎来更大的政策和市场红利期。
随着移动网络和互联网融合互通日趋明显,依托ARM架构发展后台数据中心已成为大势所趋。
由于异构计算可全面适合AI和大数据时代处理海量数据的需求,近年来发展极为迅速,成为数据中心、智能手机、5G、智能驾驶等应用领域的主流芯片架构。

异构计算在自动驾驶的演进
异构计算技术应运而生,像一个大厨将CPU、GPU、DSP、FPGA和ASIC这些优良食材制成一道融合各方口味特点的佳肴。
依托异构计算技术能够整合CPU、GPU、DSP、FPGA和ASIC不同架构的内核到单一芯片中从而适配自动驾驶的复杂计算要求。
而自动驾驶也经历了从复杂分立到高度集成异构计算芯片方案的演进。
基于异构计算技术不仅系统算力更强,而且定制的软件架构能够加速自动驾驶算法快速高效的适配。

三巨头收购布局
2020年,英特尔发布了独立显卡iRIS Xe Max。在一系列的收购行为后,英特尔弥补了PC产品线的关键零部件,也成功实现了XPU异构计算架构。
AMD对赛灵思的收购,也释放出强化异构计算布局的信号。在具备“CPU+GPU”计算架构的基础上,FPGA的可编程特质,能进一步提升计算平台的灵活性,从而适应AI时代根据不同工作负载进行加速的需求。
英伟达收购ARM,不仅弥补了缺乏CPU的短板,也将英伟达的AI计算平台拓展到移动生态。值得注意的是,ARM也在异构计算有所涉猎。

围绕异构计算的底层架构,新一轮比拼已经展开,无论是通用处理器、FPGA、GPU等通用器件,还是有种xPU等领域专用处理器或加速器,各方势力的拼杀已在暗潮涌动。
面向特定应用的优化,存在应用与架构相互匹配的问题。搭建一个统一架构不太现实。
比较现实的是开发架构虚拟原型,由应用驱动得到一个架构,然后再去制造符合架构的计算平台,最后实现架构与应用的统一。
这种技术未来有可能作为异构计算贯穿拉通的技术基础。

战略角度对我国多领域意义重大
异构计算对我国集成电路、通信等领域的发展意义重大。
在中美贸易战背景下,沿着摩尔定律路线,我国工艺、制造等很容易被封锁,而异构计算则提供了一个弯道超车的可能性。
异构计算实际上是从体系结构上另辟蹊径,因此,我国集成电路业可以尝试用各种体系结构匹配应用,得到性能、功耗、能量效率的平衡,以弥补摩尔定律所损失的战场。

结尾:
架构、工艺、互联、编程或开发环境等是让异构计算成熟的基础技术。而在开发过程中,如何实现垂直整合将是一大挑战。
未来异构计算很难突然爆发式增长,但会慢慢地渗透到各种应用中,然后改变一些应用的形态,甚至是底层逻辑。
注:原文出自 微信公众号 AI芯天下 作者:方文三 更多内容点击 AI芯天下
如有侵权,请联系,将及时删除。