服务器
    作者:徐鹏

    HPC+AI融合之路 联想智能超算的智慧一步

         [ 中关村在线 原创 ] 暂无评论

        作为一个国家综合实力的体现,超级计算机往往被称为“国之重器”。过去20年,中国超算的运行速度提高了5000多万倍,远超国际同期水平,神威·太湖之光更是蝉联TOP500榜首。在国家863计划的支持下,超算在工业制造、航天、军事、医学、科研等领域发挥着重要作用,推动了人工智能、深度学习等新技术的演进。从计算能力到应用落地,超算走过了一条曲折前行的道路,其中不仅有国家层面的持续投入,IT企业的参与同样扮演着关键角色。

        6月30日,以“智能超算”为主题的2017联想全球超算峰会在北京召开,联想在大会上发布了自主研发的全新集群——深腾8810集群,以及HPC+AI智能超算平台LiCO。在刚刚结束的ISC 2017上,联想以91套高性能计算系统入围全球HPC TOP500份额榜,连续三年获得中国第一,继续蝉联全球第二。上一个财年,联想以17%的增长率成为全球增速最快的HPC厂商。

    HPC+AI融合之路 联想智能超算的智慧一步
    联想发布深腾8810集群

    AI强载体 智能超算恰逢其时

        这一系列成绩并非偶然。联想从2001年就进军高性能服务器领域,先后为数万个用户实施了高性能集群,其研制的“深腾1800集群”是世界上首个实际速度超过1万亿次的大规模集群系统,而深腾系列HPC也是最早进入全球TOP500的国产计算机。随着2014年IBMx86业务的加入,又吸引了一大批IBM的HPC专家聚首。目前,联想不仅与全球最大的7个数据中心中的6个达成合作,还为北大、中科院、航天三院等机构提供了HPC系统,并且是包括BAT在内的互联网企业的AI GPU服务器主要供应商。

        新一代深腾8810集群由联想自主研发,拥有多项HPC和AI的关键技术,包括46项国家发明专利。与传统HPC相比,深腾8810集群加入了对人工智能的全面支持,涉及软件(LiCO)、应用等层面。作为HPC+AI智能超算平台,LiCO在HPC软硬件平台上整合支撑了各种深度学习应用,融合了主流的人工智能框架,例如Tensorflow、Caffe、MXNET等。同时,LiCO分布式的资源调度系统,可以帮助用户应对深度学习训练不断增长的计算需求,而端到端的解决方案包含数据预处理、训练、参数调整、过程监控、测试等,能够让用户专注在AI算法和业务应用上。

        尼葛洛庞帝曾经提到,技术创新是互联网未来发展的主要驱动力,而人工智能恰恰走到了技术与商业的十字路口,这一场景与超算的发展何其相似。从阳春白雪到形成完整的产业链,超算作为AI的强载体,其计算力是企业智慧化转型的重要支撑,二者的关系是恰逢其时,互惠互利。

        任何一项新技术的诞生,都为行业参与者带来了一次弯道超车的机会。继去年基于太湖之光系统的三项全机应用入围“戈登贝尔奖”之后,HPC的应用已经被越来越多的人所关注,而如何让超算的落地更有价值,这就要结合AI提供更智能的服务。可以说,联想此时提出“智能超算”的概念正是时机。

        联想首席科学家祝明发表示:“人工智能产业还处于发展初期,而高性能计算能力为AI的实现提供了更多可能,它的计算力是人类远不能比的。通过计算能力的提高,可以让机器做到人类想象不到的事情,就像下棋一样,人类以为机器下棋不能下过人。”

    HPC+AI融合之路 联想智能超算的智慧一步
    联想首席科学家祝明发

        普华永道预计,到2030年AI对全球经济的贡献将达到15.7万亿美元,进而推动当年的全球GDP增长14%。其中,中国从AI获得的好处要多于其他任何国家,原因是制造业在中国GDP的占比更高。一方面,AI促进了企业内部流程迈向自动化,加强单位劳动力价值,另一方面AI也刺激着用户的消费需求,让广告主可以提供更个性化、更高品质的商品。

    构建HPC+AI生态 掘金智慧转型

        为了抓住人工智能时代企业应用的新机遇,联想围绕AI+HPC构建了软硬一体化的解决方案,涉及产品、人才、生态等多个维度。在京东,联想优化GPU架构后的5000个计算节点,正在支持着其消费者购买习惯分析等算法,服务6000万客户。存储节点上,联想加入了分布式存储产品,使得数据的开放性、多样性、可靠性大幅提升。

        据了解,联想将在中国北京、美国莫里斯维尔、德国斯图加特成立全球AI创新中心,预计在今年底正式启用。产品层面,除了深腾8810集群和LiCO,联想还会为AI创新中心配备新一代基础架构ThinkSystem,后者是涵盖服务器、存储和网络系统的完整解决方案,拥有跨平台和多工作负载的特性,密度是上一代产品的两倍,足以应对高性能计算、超大规模应用、人工智能等领域的挑战。同时,联想还采用了英伟达GPU和英特尔至强应用于深度学习。

        全球化布局一直是联想的优势,这种模式的双向互补为资源共享和部门协作奠定了基础。以LiCO为例,其由中国团队研发应用于本土市场,后来才逐渐被推广至全球。联想HPC和AI资深架构师郝常杰透露,联想在全球有12个全球性的研发中心,均是针对不同产品和应用场景设置,分别面向PC+笔记本、数据中心、设备+云。至于软件研发,联想在北研有人工智能实验室,涉及语音识别、图像识别等职能。具体到联想AI创新中心,三者之间有协调机制和统一的运维体系。

    HPC+AI融合之路 联想智能超算的智慧一步
    联想HPC和AI资深架构师郝常杰

        人才方面,联想研究院近几年的人才引进都是以人工智能研究为主,包括深度学习、做计算机视觉等领域,例如联想集团副总裁、企业服务云计算研究室、无线研究实验室的黄莹博士,以及前微软亚洲研究院常务副院长、现联想集团高级副总裁兼CTO芮勇博士。芮勇博士是2016 IEEE计算机学会技术成就奖获得者,未来他的团队将坚持以用户为中心,发展面向行业的人工智能系统。

        生态方面,联想深知高性能计算产业单枪匹马无法解决所有问题,需要上下游厂商的配合。因此,其加强了与各领域合作伙伴的联系,打造HPC+AI的完整生态圈。除了在硬件层面与英特尔、英伟达、Mellanox等厂商合作,还在软件层面主动开放生态系统,吸引主流软件厂商(如红帽)加入联盟。同时,联想创投也在发掘应用层面具有潜力的科技创新公司,投资了Face++、银河水滴科技等。可以看到,联想在人工智能领域的布局发挥了整个集团的联动效应。

        人工智能在资本市场的热潮与日俱增,无论是像阿里云、腾讯云这样的云服务商,还是像谷歌、百度这样的搜索巨头,都在深耕AI。与这些企业相比,联想的人工智能系统包括网络、存储、管理节点、推理节点等,是个软硬件综合体。祝明发表示,联想从基础研究到方法论,再到软硬件构建了完整方案,“我们的要求是‘人有我优’,‘优’体现在产品的质量、可靠性、稳定性。联想做AI技术研究的目的不是要成为AI公司,而是要使软硬件系统更适合AI应用。” 

        目前,联想的HPC解决方案已经应用于政府、科研、教育、气象和海洋、石油石化、CAE仿真计算、生命科学、航空航天、深度学习等领域。郝常杰谈到,联想针对行业特性制定了不同的策略,运算能力、节点连接、数据I/O各有侧重点,“对于一些常见的高性能计算应用,我们的工程师团队会提前在平台上测试,确保这些软件可以稳定运行,并且效率更高。”

    结语

        今年3月,人工智能首次被写入政府工作报告,标志着AI已经上升到国家战略。随着技术的演进以及产业发展趋于成熟,AI在数字化进程中将发挥更重要的作用,智慧化的体验和服务成为产业升级的推动力。对于联想来说,通过模块化服务器、水冷系统、LiCO等产品层面的创新,结合各领域的落地应用,找到了HPC和AI的完美融合点,为企业智慧转型提供了方法论和成功实践。

        面向千亿级的市场规模,联想再次抢先布局,致力于打造符合AI发展趋势和客户智能业务发展需求的HPC基础设施和业务场景。正如联想集团高级副总裁、数据中心集团中国区总裁童夫尧所说:“未来,我们将进入一个人工智能研究及应用创新集中爆发的时代,人工智能只有在强大计算力的支持下,通过和成熟的算法、大数据相结合,才能真正做到改变世界。”

    关注排行榜

    产品品牌

    文章推荐

    互动沙龙

    相关内容 网友评论 返回首页
    专家咨询