热点:
    ZOL首页 > 服务器 > 正文

    性能提升超越摩尔定律!浪潮AI服务器再创MLPerf V2.0训练评测最佳成绩

      [  品牌资讯   ]   作者:十一

    6月30日,全球权威AI基准评测MLPerf最新V2.0训练评测成绩榜单公布。浪潮AI服务器表现优异,继两月前在MLPerf V2.0数据中心推理评测中斩获全部冠军后,本次又在MLPerf V2.0单机训练性能继续保持领先。

    本次MLPerf评测吸引了包括谷歌、NVIDIA、浪潮信息、百度、Intel-Habana、Graphcore等全球21家厂商和研究机构参与,共有264项评测成绩提交,是上一轮基准评测的1.5倍。评测任务涵盖了当下主流AI场景,包括自然语言处理(BERT)、智能推荐(DLRM)、图像分类(ResNet)、医学影像分割(3DU-Net)、轻量级目标物体检测(RetinaNet)、重量级目标物体检测(MaskR-CNN)、语音识别(RNN-T)以及强化学习(Minigo)8类AI任务。

    在单机训练评测的固定任务中,浪潮信息以高端AI服务器斩获自然语言理解(BERT)、智能推荐(DLRM)、语音识别(RNN-T)三项性能成绩第一,位列单机冠军榜首。在本次配置8颗NVIDIAA100 Tensor CoreGPU的主流高端AI服务器中,浪潮AI服务器斩获5项任务最佳成绩(BERT、DLRM、RNN-T、ResNet、MaskR-CNN)。

    超越摩尔定律,持续领跑AI计算性能提升

    MLPerf评测组织机构MLCommons执行主任David Kanter在此次成绩发布会上表示,自首次公布评测基准以来,MLPerf性能提升速度远超过摩尔定律。考虑到业界对计算和AI的需求正以惊人的速度增长,这让人非常振奋。

    自参加MLPerf AI性能评测以来,浪潮AI服务器通过软硬件全面优化,持续实现AI性能突破。相较于2018年12月MLPerf初始版本V0.5的典型配置8卡机型的性能数据,浪潮AI服务器的性能显示出大幅提升,提升比例最高达789%,2.35倍于摩尔定律增速。

    浪潮AI服务器在MLPerf基准评测中的卓越表现,得益于浪潮信息在AI计算系统上优异的设计创新能力和全栈优化能力。浪潮AI服务器针对AI训练中常见的密集I/O传输瓶颈,通过PCIe retimer-free设计实现了CPU-GPU间通道免中继高速互联,大幅降低通信延迟;并针对高负载多GPU协同任务调度,以及NUMA节点与GPU之间的数据传输性能进行了深度优化,确保训练任务中的数据I/O通路处于最高性能状态;在散热层面,率先实现4U空间内部署8颗500W的高端NVIDIA A100 Tensor CoreGPU,并支持风冷、液冷两种散热方式。同时,在模型训练全流程中,浪潮AI服务器持续通过优化预训练数据处理、GPU之间高速通信、GPU核心加速等关键模块,最大化提升了AI模型的训练性能。

    大幅提升Transformer训练性能

    当前,基于Transformer神经网络的预训练大模型正引领新一代AI算法发展,并逐步从自然语言处理走向计算机视觉、多模态等领域。MLPerf评测任务中的BERT模型即是基于Transformer架构的模型。Transformer简洁、可堆叠的架构使得开发极大参数量、基于极大数据集的预训练大模型成为可能,这带来了模型算法能力的大幅提升,但同时也对AI计算系统的处理性能、通信互联、I/O性能、并行扩展、拓扑路径及散热能力提出了更高的要求。

    在本次BERT评测任务中,浪潮AI服务器通过优化数据预处理、GPU之间密集参数通信、超参数自动寻优等,进一步提升了BERT训练性能,在15.869分钟内即在Wikipedia数据集的2850176条数据上完成了3.3亿参数的BERT模型训练,相较于V0.7版本的最佳成绩49.01分钟的性能提升达到309%。至此,浪潮AI服务器已经连续三次获得MLPerf训练BERT任务性能冠军。

    浪潮信息在MLPerf V2.0训练评测中取得佳绩的2款AI服务器分别是NF5488A5及NF5688M6。NF5488A5是全球首批上市的NVIDIA A100 Tensor Core GPU服务器,在4U空间支持8颗由NVIDIA NVLink互联的NVIDIA A100 Tensor Core GPU和2颗AMD Milan CPU,同时支持液冷和风冷散热技术,累计斩获40项MLPerf冠军。NF5688M6是面向大规模数据中心优化设计的具备极致扩展能力的AI服务器,支持8颗第三代NVLink互联的NVIDIA A100 Tensor Core GPU 和两颗Intel Ice Lake CPU,支持多达13张PCIe Gen4的IO扩展能力,累计斩获25项MLPerf冠军。

    server.zol.com.cn true http://server.zol.com.cn/795/7959244.html report 3256 6月30日,全球权威AI基准评测MLPerf最新V2.0训练评测成绩榜单公布。浪潮AI服务器表现优异,继两月前在MLPerf V2.0数据中心推理评测中斩获全部冠军后,本次又在MLPerf V2.0单机训练性能继续保持领先。本次MLPerf评测吸引了包括谷歌、NVIDIA、浪潮信息、百度、Intel-Haban...
    • 猜你喜欢
    • 最新
    • 精选
    • 相关
    周关注排行榜
    • 产品
    • 品牌
    推荐问答
    提问
    0

    下载ZOL APP
    秒看最新热品

    内容纠错