且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

人工智能花开三朵,如何完整绽放?

更新时间:2022-08-17 20:32:39


如今,围绕在人工智能领域有两种极端的认知。一种看法认为,人工智能将无所不能,它会在未来建立新的人类社会规范;而另一种看法,则对人工智能非常抵触,认为人工智能会毁掉人类的根基。

 

天使与魔鬼并存,这是不是人工智能最真实的写照?其实都不是。

 

9月7日,AICC人工智能计算大会在北京召开,与业界所有有关人工智能的大会不同的是,这场会议多了“计算”两个字,殊为关键。为什么呢?

 

在云计算和大数据之后,人工智能成为了当下最热门的风口。最新数据显示,目前中国已拥有592家人工智能公司,占全球总数的23%,仅2016年一年,中国在人工智能领域就有超过200亿元的投资。


人工智能花开三朵,如何完整绽放?


虚热不断的人工智能概念,却总是忽略了技术本身。中国工程院院士、浪潮集团首席科学家王恩东说,“人工智能的发展、人工智能的支撑,离不开计算、算法和数据这三大属性。尤其是计算,正是由于计算能力的快速发展,结合互联网、物联网带来的海量数据和深度学习等先进算法,才共同催生了第三次人工智能浪潮。”

 

可见,计算、算法和数据三个维度的突破,有了人工智能绽放的可能。

 

市场环境为数据和算法打下基础

 

前不久我国发布了《新一代人工智能发展规划》,将人工智能正式上升为国家战略,人工智能将在我国从“世界工厂”向“世界智能工厂”转型中将起到重要作用。


人工智能花开三朵,如何完整绽放?

这表示,政策环境对人工智能产业的支持正向更好的一面发展。《新一代人工智能发展规划》是7月20日公布了,其中明确提出了中国人工智能“三步走”战略、八大关键技术研究、数十个产业落地、AI人才的培养和引进、以及成立人工智能规划推进办公室等战略规划。

 

可以说,这是中国人工智能产业发展的总体纲领,也为人工智能发展所需的技术环境打下了基础。因为人工智能创新应用的发展离不开数据的开放和共享。从国际上看,开发、开放和共享***数据已经成为普遍潮流,英美等发达国家已经在公共数据驱动人工智能方面取得一定成效。而我国此前仍缺乏国家层面的整体战略设计与部署,***数据开放仍处于起步阶段。所以,有了国家政策的支持,数据的开放也会逐渐深入,这对人工智能在数据层面的完整和健全会起到明显的作用。

 

其次在算法层面。因为互联网公司的崛起,他们是最早一批布局人工智能的企业。所以,近年间,笼络了大量机器学习的人才,同时又有互联网业务的实践,所以对算法层面的进步起到了不小的作用。

 

可以说政策环境驱动了数据链条的完整,而市场环境驱动了算法的进步。那么,计算力的发展要靠谁来推动呢?王恩东说,“尽管计算已经有了快速的发展,但面对人工智能这样一个蓬勃发展的需求,仍然面临着许多挑战,排在第一位的仍然是计算性能。”正是为了计算不再成为人工智能的短板,AICC人工智能计算大会的意义就是让数据、算法和计算达到融合,并做到助推人工智能产业升级的目的。

 

计算支撑优化组合,做到在AI时代胜出

 

实际上,我们会发现凡是在人工智能领域走得比较早的企业,他们所建立起来的优势很难被撼动。这些公司大部分是互联网公司,首先互联网公司更早的看到了数据的价值,所以他们的数据链条相对完善;其次,互联网公司切入人工智能更早,所以学习的算法以及成果更出色,后来者想要追赶这些公司的步伐,即便有了同样的数据,也需要很长时间的深度学习来达到先行者今天的水平。

 

这难道就是一个无解的难题吗?


人工智能花开三朵,如何完整绽放?


高效能服务器与存储技术国家重点实验室科学家、浪潮集团副总裁胡雷钧告诉我,“大家所说的人工智能三要素,数据,模型算法,和计算能力。谁能够把这三个组成一个性价比最优的组合,谁就能胜出。”

 

比如,如果数据少,但模型算法更好,就意味着层次更多、节点更多,精度更高。那么,模型越大,就需要计算能力更强。而好的模型和更强的计算能力的组合,有可能弥补在数据上的不足。可见,计算力的提升实际上,给予人工智能公司很大的想象空间。

 

而对于算法的发展,胡雷钧也寄予很高的期待,“计算能力和数据实际上是需要钱的,是需要大投资的,还需要实践的积累和投资的积累,反而在计算模型上的投入,有可能在有限投资的情况下获得更大的收益,获得更大的平衡。”

 

这意味什么?算法模型上的巨大突破,也会弥补计算力的不足。所以,人工智能领域里的机器学习,现在的算法,以及计算的发展会互相推动,再进行进一步的组合,实现如今不能想象的未来。“如果说,今天的人工智能公司,投入的早积累的多,就有优势,可是以后就未必。”

 

过去,业界对人工智能的关注,过于局限在算法和数据两个方面,而我们经过这些这些理论和实践会发现,计算对于人工智能发展的重要程度,正在日益凸显。

 

打破AI计算的瓶颈,建立体系化的生态系统

 

这几年来,人工智能的技术虽然走很快,但是却比较零散,并没有一个公认的技术体系。胡雷钧认为,“人工智能要想继续往前发展,就必须体系化、层次化的构建它的生态系统。有一个相对完整的生态系统的支撑,我们才能推动计算系统能够面向应用需求。在具体的实践中,我们认为AI的计算平台、AI的系统管理、AI的计算框架、AI的应用方案作为一个生态系统里不可或缺的几个重要环节,在滚动推动着AI的发展。”

 

随着更多的人工智能应用出现,AI计算平台也会遇到很多瓶颈,比如数据的瓶颈、计算能力的瓶颈、延迟的瓶颈、通信能力的瓶颈等等。这里有三个核心的问题:第一处理单元能多快速度的取到它处理的数据,第二每次处理之后能以多快的速度去交换数据,这是通讯问题。第三在单位的空间内能集成多少计算能力。胡雷钧说,“这是约束着一个计算系统最大规模也是约束着我们能以多快的时间完成一个模型的训练的问题。”

 

所以,在这些需求之上,浪潮构建了自己的人工智能价值体系。

 

首先是基于计算平台的创新:由于提高单位空间之内的计算能力和计算单元之间交互数据的能力,浪潮在2U空间内能集成8个,甚至以后可能更多的GPU处理器,以获得最高的计算能力。浪潮还通过服务器与GPU BOX的分离,拥有了更灵活的计算组合,以便适应各种不同的神经网络的模型。

 

其次,在管理平台上,浪潮在思考如何把云计算的技术、云计算调动大规模运算的技术应用到AI计算上来,为AI开发者和运维者面临的各种巨量的运算应用提供一个管理模式,所以浪潮提供了一个计算框架的分析工具,通过这个分析工具可以细微地看一个具体的神经网络的模型在某一个计算平台里的运算表现,或是系统瓶颈

 

第三,是人工智能的框架,浪潮做了Caffe-MPI。浪潮是首个把Caffe的计算模型从原先的单机版扩展成为集群版,通过这个集群版可以做到在一个系统里运行更大尺寸的神经网络,同时通过MPI的编程能够更有效的调动系统的资源来完成一个高性能计算。

 

胡雷钧说,“这实际上就是把我们在高性能计算领域里的应用模式和应用方法移植到了AI的平台上,通过我们原先已经有的在大规模计算平台上的经验,提高AI应用或者说提高神经网络的训练效率。”值得一体的是,Caffe-MPI目前还是一个由浪潮贡献的开源项目。

 

第四,面向AI的应用,浪潮提供了E2E的解决方案。一整套的方案当中,浪潮有高密度高性能的模型训练的平台AGX-2,它是目前世界上最高密度的AI计算平台,在2U空间之内支持NVLink,支持P100GPU,有基于FPGA的F10A加速卡,有高效的人工智能管理平台AIStation,有高性能深度学习框架Caffe-MPI,同时浪潮还有非常有经验的工程师队伍可以帮助优化算法。

 

基于这些不同层面的投入,浪潮打造了一个面向AI的生态,如胡雷钧所说,“浪潮希望在产业基础的推动下往前滚动发展,未来一定能更好的支持我们的AI应用,无论是训练、学习、现在的监督式学习还是正在发展的自主学习、未来终极目标类脑的学习,都会以非常好的基础来支撑我们。”

 

在我看来,AICC人工智能计算大会的意义是重新定义了,计算在人工智能价值体系中的定位,以计算作为支撑,实现计算、数据和算法三者的优化组合,并相互促进,最终开出的才是人工智能最美的花朵。