昇腾AI大模型开发使能平台来了原来大模型开发也能如此“亲民”

2022-06-21 09:30:24 [ 中关村在线原创 ] 作者：陈赫

从工业生产线上能自动检测产品是否合格的AI质检，到生活中可感知室内温度并自动打开空调进行调节的智能家居终端，人工智能已渗入人类生产生活的方方面面，更有“全能AI，能说会道，琴棋书画样样精通”的说法。

这不，最近AI作画在全球大火，只需要输入一句话，AI就能自动生成符合情景的画作。这是如何做到的？其实就是一款叫做DALL-E的AI基础模型，初期时作画能力还比较粗糙，在一年内“喂”了它6.5亿张图片进行训练后，进化成了DALL-E2模型，就能够根据复杂甚至奇葩的文字进行作画，这就是AI大模型的强悍之处。

但在产业中的AI大模型就没这么“亲民”了，一般只有高校、科研机构、大厂才具备研发大模型的实力。究其原因，是从样本采集到对海量样本进行分析再到模型训练，这几个环节加起来会产生非常大的人力财力物力的投入。企业要想自己开发一个大模型，通常需要经过三项流程即基础模型开发、行业应用适配、模型推理部署，这个过程中的时间与资源成本显然是巨大的。

如何解决这一难题？华为在近日举行的“华为伙伴暨开发者大会2022”上推出了昇腾AI大模型开发使能平台。通过大模型开发套件、大模型微调套件、大模型部署套件这三大核心套件，解决了从「基础模型开发、行业应用适配、模型推理部署」整个开发流程的难题，加速大模型开发部署全流程，让大模型易开发、易适配、易部署。

昇腾AI大模型开发使能平台

首先，在基础模型开发方面，华为将昇思MindSpore与ModelArts结合，推出大模型开发套件。昇思MindSpore提供自动混合的并行API，让开发者无需进行模型切分，自动实现大模型在集群上的训练。同时具备有内存复用、断点续训等功能，更是给大模型开发提速。

昇思MindSpore具备业界领先的全自动并行能力，即支持并行维度业界最多，如数据并行、模型并行、流水并行、优化器并行、子图并行等六维并行策略；大模型切分支持结构最全，如稠密Transformer、稀疏MOE Transformer、卷积结构、卷积+Transformer、高维稀疏等。简单说，就是一行代码便可实现模型的自动切分与分布式并行计算。昇思MindSpore还拥有全局内存复用能力，在开发者毫无感知的情况下，可自动实现NPU/CPU/硬盘的多级存储优化，仅用512卡就可训练10万亿参数模型，极大地降低了大模型的训练成本。此外，昇思MindSpore提供的断点续训特性，可解决大集群训练故障导致的任务中断问题，实现自动恢复与继承性训练，让开发者无需再从头开始，经验证千亿参数模型可在分钟级实现无损恢复。

其次，在行业应用适配过程中，MindX提供了大模型微调套件。通过预置典型行业任务微调模板，以小样本学习等手段，可快速适配各种行业应用。

在行业应用适配中，除了应用数据难获取之外，开发者所面临的就是下游任务微调效率低的问题。平台提供的大模型微调套件，通过内置微调模板，支持下游任务灵活配置，实现一键微调，可满足不同应用场景的下游任务开发需求，实现小样本低参微调，有效提升下游任务开发效率。

最后，在模型部署推理方面，MindStudio提供了大模型部署套件，让模型高效部署应用。

针对开发者常面临的部署环境算力不足、部署门槛高等难题，MindStudio提供的大模型部署套件提供了量化、剪枝、蒸馏的模型轻量化能力。

开发者在进行离线部署时，可将模型自动压缩，实现10倍级的压缩率。最最重要的是，平台还提供了模型加密能力，通过动态模型混淆，保障模型部署态安全，让模型安全有保障。

结语

昇腾AI大模型开发使能平台的推出，从平台自身来说，能够大幅降低大模型的开发和部署门槛，汇聚伙伴和开发者的力量，加速大模型产业落地，为千行百业进行赋能。

放眼整个生态，在昇腾AI大模型开发使能平台上，华为将联合众多高校和科研院所一起，基于昇腾AI，开展大模型的研究和创新，打造世界级的领先大模型，推动中国大模型创新跻身世界前列，为人工智能产业开创新辉煌。