admin管理员组

文章数量:1530845


2024年6月20日发(作者:)

智能+

May

05 2019 221

通信运营商布局AI芯片

刘童桐

︱ 文

深度学习带动了本轮人工智能浪潮的大发展,AI芯片成为人工智能产业发展的核

心驱动力,AI芯片产业通过引入GPU突破了CPU并行计算短板,AI芯片已经成为业

界研究的热点。 本文分析了当前四类主流AI芯片的技术特点,认为ASIC芯片更符合

未来的发展趋势,并对通信运营商在AI芯片领域研发布局提出了四项建议。

数据推理出各种结论。总体来看,训练环节对

芯片成为AI产业核心驱动力

深度学习带动了本轮人工智能浪潮的大发

展,而海量数据和AI芯片提供的高效算力是支

撑深度学习算法实现的基础,AI芯片对人工智

能的意义,就像发动机之于汽车。当前,对AI

芯片尚无公认的标准定位,广义上,能驱动AI

程序的芯片都可叫AI芯片;狭义上,AI芯片

是为适应AI算法进行特殊设计的芯片。

从功能上来看,AI芯片需满足训练和推理

两个环节。在训练环节,通过大数据训练出一

个复杂的神经网络模型。目前,训练环节主要

使用英伟达的GPU(图形处理单元)集群完成,

谷歌的TPU2.0也支持训练环节和深度网络加

速。在推理环节,利用训练好的模型,使用新

芯片性能要求比较高,推理环节对简单指定的

重复计算和低延迟的要求很高。

从应用场景来看,AI芯片既用于云端也用

于设备端。在训练环节,需要极大的数据量和

运算量,单一处理器无法独立完成,只能在云

端实现。在设备端,智能终端的数量庞大,需

求差异较大,比如VR设备对于实时性要求很高,

推理环节无法在云端完成,要求设备有独立的

推理计算能力。

从技术架构来看,人工智能芯片主要可分

为四类。一是通用性芯片,如GPU;二是以

FPGA(现场可编程门阵列)为代表的半定制化

芯片,如深鉴科技的DPU;三是ASIC(专用

集成电路)全定制化芯片,如谷歌的TPU;四

是类脑芯片。

中国电信业

Copyright©博看网. All Rights Reserved.

CHINA TELECOMMUNICATIONS TRADE

13

封面文章

Cover Story

智能+

的ASIC一旦制造完成将不能更改,所以初期

四类主流AI芯片技术特点分析

GPU:即图形处理器,是一种大规模并行

计算架构的众核处理器,专为同时处理多重任

务而设计,原本主要帮助 CPU处理图形显示的

任务,尤其是3D图形显示。为了执行复杂的

并行计算,快速进行图形渲染,GPU的核数远

超CPU,但每个核拥有的缓存相对较小,数字

逻辑运算单元也更简单,更适合计算密集型的

任务。GPU硬件结构固定,不具备可调整性。

FPGA:现场可编程门阵列,利用门电路

直接运算,速度快,用户可自定义门电路和存

储器之间的布线,改变执行方案,以期得到最

佳效果。FPGA可采用OpenCL等更高效的编

程语言,降低了硬件编程的难度,同时可以集

成重要的控制功能,整合系统模块,提高了应

用的灵活性。FPGA作为专用集成电路领域的

一种半定制电路出现,既解决了定制电路灵活

性不足的问题,又克服了原有可编程器件门电

路数量有限的缺点。与GPU相比,FPGA具备

更强的计算能力和更低的功耗。

ASIC是不可配置的高度定制专用计算芯

片。不同于GPU和FPGA的灵活性,定制化

表1:四类主流AI芯片技术特点比较。

GPU

高低低

成本高、开发周期长、进入门槛高。但ASIC

性能高于FPGA,相同工艺的ASIC计算芯片

比FPGA计算芯片快5~10倍,而规模效应

会使ASIC成本大幅降低。总体来看,ASIC芯

片在功耗、可靠性、体积方面均有优势,尤其

适用于对性能、功耗、体积要求较高的移动端

设备。

类脑芯片还处于理论研究阶段,主流理念

采用电子技术模拟已被证明的生物脑的运作规

则,构建类似于生物脑的电子芯片,即“仿生

电子脑”。受到脑结构研究的成果启发,复杂

神经网络在计算上具有低功耗、低延迟、高速

处理、时空联合等特点。

四类AI芯片的技术特点总结如表1所示。

ASIC芯片前景看好

分析可知,GPU和FPGA都属于AI通用

芯片,在性能、应用广泛性等方面都有一些局

限。类脑芯片是一种相对处于概念阶段的集成

电路,面世的不多,大规模的商用进展缓慢。

而ASIC芯片作为全定制化芯片,从长远看更

3D图像处理,密

集型并行计算,深

度学习训练

金融分析,图像视

频处理,深度学习

推断

为实现特定需求而

定制

Intel、NVIDIA、AMD

FPGA

中中中中

Xilinx、Intel(Altera)、

Microsemi、Lattice、

深鉴科技(DPU)

谷歌(TPU)、寒武

纪(NPU)、地平线

(BPU)、比特大陆(算

丰)、云知声(UniOne)、

NovuMind

(NovuTensor)

ASIC

低高高低

类脑芯

低中高低

模拟人脑功能进行IBM(Truenorth)、

感知、行为和思考,Intel(Loihi)、清华

处于早期研究阶段 大学(天机)、高通

(Zeroth)

14

中国电信业

CHINA TELECOMMUNICATIONS TRADE

Copyright©博看网. All Rights Reserved.

智能+

May

05 2019 221

适用于行业人工智能解决方案。因为算法复杂

度越高,越需要一套专用的芯片架构与其进行

对应,ASIC基于人工智能算法进行定制,其发

展前景看好。

当前,ASIC芯片市场百家争鸣,国内外

主流芯片厂家均推出了相应的芯片。英伟达

(NVIDIA)发布了一款全新的AI芯片Jetson

Xavier,每秒可执行30万亿次操作,功率仅为

30瓦。谷歌发布了TPU3.0,性能进一步提升。

IBM提出的基于PCM的个性化AI芯片,可达

到GPU 280倍的能源效率,并在同样面积上实现

100倍的算力。英特尔发布了专为机器学习而设

计的神经网络处理器系列芯片Lake Crest。百度

宣布了首款AI芯片昆仑,是中国首款云端全功

能AI芯片,是目前为止设计算力最高的AI芯片,

且功耗仅为100+W。华为发布了昇腾910和昇

腾310两款AI芯片,前者的单芯片计算密度比

目前最强的NVIDIA V100的125T还要高上一

倍,后者是昇腾的mini系列。

二是研发基于AI专用芯片的人工智能终

端产品和应用系统,助力AI赋能垂直行业。加

速AI终端产品和应用系统的研发,不断提升

AI能力和产品覆盖水平。在用户端积极布局智

能终端产品;在网络侧致力于打造网络运维大

脑,提升面向下一代网络的智能运维能力;在

应用侧注重场景驱动,探索能力开放运营和生

态合作,积极切入智能家居、智慧城市等垂直

领域,推动AI变现。

三是在网络领域使用搭载AI专用芯片的

定制化高性能服务器,增强云端训练和推理能

力,提高通信网络智能化水平。5G网络将进

一步开放实现分层解耦,网络各层逐步使用搭

载AI专用芯片的定制化高性能服务器,可促

进AI的应用。在基础设施层使用AI专用芯片,

实现不同层级的训练和推理能力,比如在核

心数据中心引入AI专用芯片可以满足全局性

的策略或算法模型的集中训练以及推理需求。

在基站内嵌入AI专用芯片,可以支撑设备级

的AI策略及应用。在网络和业务控制层,可

以利用AI专用芯片推理能力,对网络和业务

通信运营商布局建议

AI赋能通信已成为通信运营商重要的发

展战略。当前国内几大通信运营商基于英伟达

P40、P4、V100等系列GPU芯片产品,研发

支撑现网业务需求的人工智能基础平台和应用,

在网络运维、在线客服、市场营销、系统安全、

企业管理等业务场景下,已经做出了一些实践

和探索,但尚未有运营商直接开展AI芯片技术

相关的研发工作。在此笔者提出几条建议,建

议通信运营商在AI芯片领域提前布局,助力企

业人工智能战略的推进和相关工作的开展。

一是加强与科研机构和产业界的沟通合作,

支撑企业集采和投资分析。在开展网络智能化

重构、5G创新试验的同时,及时掌握AI芯片

产业发展情况,分析和探索不同AI芯片在企业

各种业务领域的具体应用场景及选型策略,支

撑5G智能终端和AI芯片产品的集中采购工作。

同时跟踪AI芯片领域初创企业发展动态,适时

开展AI芯片领域战略性布局的投资或收购。

实现智能控制,如网络智能运维及智能调优,

通过机器学习快速拦截恶意行为、预防攻击,

维护网络安全等。在运营及编排层,可以利用

AI专用芯片云端训练能力,对数据做深度、

智能化挖掘,从而指导运维和运营,实现运营

智能化。

同时可尝试CPU + FPGA + ASIC的芯片

“混搭”架构,研究和试验各类AI应用场景下,

不同技术架构芯片的组合使用方式,增强企业

核心AI能力。

四是探索基于AI专用芯片的多接入边缘

计算技术的应用场景,提升5G网络服务能力。

研究边缘计算设备与AI的结合,开展基于AI

专用芯片的边缘计算试点,研究和分析适合在

终端计算节点上开展的业务应用场景,如自动

驾驶、安防、VR等,设计匹配该类业务的网

络架构,提升5G网络服务能力。

作者单位:中国移动通信研究院

中国电信业

Copyright©博看网. All Rights Reserved.

CHINA TELECOMMUNICATIONS TRADE

15


本文标签: 芯片专用网络训练