从工业生产线上能自动检测产品是否合格的AI质检,到生活中可感知室内温度并自动打开空调进行调节的智能家居终端,人工智能已渗入人类生产生活的方方面面,更有“全能AI,能说会道,琴棋书画样样精通”的说法。
这不,最近AI作画在全球大火,只需要输入一句话,AI就能自动生成符合情景的画作。这是如何做到的?其实就是一款叫做DALL-E的AI基础模型,初期时作画能力还比较粗糙,在一年内“喂”了它6.5亿张图片进行训练后,进化成了DALL-E2模型,就能够根据复杂甚至奇葩的文字进行作画,这就是AI大模型的强悍之处。
但在产业中的AI大模型就没这么“亲民”了,一般只有高校、科研机构、大厂才具备研发大模型的实力。究其原因,是从样本采集到对海量样本进行分析再到模型训练,这几个环节加起来会产生非常大的人力财力物力的投入。企业要想自己开发一个大模型,通常需要经过三项流程即基础模型开发、行业应用适配、模型推理部署,这个过程中的时间与资源成本显然是巨大的。
如何解决这一难题?华为在近日举行的“华为伙伴暨开发者大会2022”上推出了昇腾AI大模型开发使能平台。通过大模型开发套件、大模型微调套件、大模型部署套件这三大核心套件,解决了从「基础模型开发、行业应用适配、模型推理部署」整个开发流程的难题,加速大模型开发部署全流程,让大模型易开发、易适配、易部署。
昇腾AI大模型开发使能平台
首先,在基础模型开发方面,华为将昇思MindSpore与ModelArts结合,推出大模型开发套件。昇思MindSpore提供自动混合的并行API,让开发者无需进行模型切分,自动实现大模型在集群上的训练。同时具备有内存复用、断点续训等功能,更是给大模型开发提速。
昇思MindSpore具备业界领先的全自动并行能力,即支持并行维度业界最多,如数据并行、模型并行、流水并行、优化器并行、子图并行等六维并行策略;大模型切分支持结构最全,如稠密Transformer、稀疏MOE Transformer、卷积结构、卷积+Transformer、高维稀疏等。简单说,就是一行代码便可实现模型的自动切分与分布式并行计算。昇思MindSpore还拥有全局内存复用能力,在开发者毫无感知的情况下,可自动实现NPU/CPU/硬盘的多级存储优化,仅用512卡就可训练10万亿参数模型,极大地降低了大模型的训练成本。此外,昇思MindSpore提供的断点续训特性,可解决大集群训练故障导致的任务中断问题,实现自动恢复与继承性训练,让开发者无需再从头开始,经验证千亿参数模型可在分钟级实现无损恢复。
其次,在行业应用适配过程中,MindX提供了大模型微调套件。通过预置典型行业任务微调模板,以小样本学习等手段,可快速适配各种行业应用。
在行业应用适配中,除了应用数据难获取之外,开发者所面临的就是下游任务微调效率低的问题。平台提供的大模型微调套件,通过内置微调模板,支持下游任务灵活配置,实现一键微调,可满足不同应用场景的下游任务开发需求,实现小样本低参微调,有效提升下游任务开发效率。
最后,在模型部署推理方面,MindStudio提供了大模型部署套件,让模型高效部署应用。
针对开发者常面临的部署环境算力不足、部署门槛高等难题,MindStudio提供的大模型部署套件提供了量化、剪枝、蒸馏的模型轻量化能力。
开发者在进行离线部署时,可将模型自动压缩,实现10倍级的压缩率。最最重要的是,平台还提供了模型加密能力,通过动态模型混淆,保障模型部署态安全,让模型安全有保障。
结语
昇腾AI大模型开发使能平台的推出,从平台自身来说,能够大幅降低大模型的开发和部署门槛,汇聚伙伴和开发者的力量,加速大模型产业落地,为千行百业进行赋能。
放眼整个生态,在昇腾AI大模型开发使能平台上,华为将联合众多高校和科研院所一起,基于昇腾AI,开展大模型的研究和创新,打造世界级的领先大模型,推动中国大模型创新跻身世界前列,为人工智能产业开创新辉煌。
本文属于原创文章,如若转载,请注明来源:昇腾AI大模型开发使能平台来了 原来大模型开发也能如此“亲民”http://server.zol.com.cn/795/7950342.html