每经记者:王晶 每经编辑:梁枭
当前,国内大模型进展不断。7月7日,在华为开发者大会2023(Cloud)上,华为常务董事、华为云CEO张平安发布了盘古大模型3.0。据他介绍,盘古大模型3.0是一个面向行业的大模型系列,包括“5+N+X”三层架构。
(资料图片仅供参考)
传统的AI开发模式下,一个场景对应一个模型,数据质量差、样本少,模型精度差,并且应用场景相对单一。不同行业、不同场景对AI的需求既复杂且碎片化,每个痛点都需要进行定制化地开发和改造;另一方面,AI算法从理论上能够极大提升产品及服务的价值量,但由于开发过程中存在大量的碎片化因素,不同的应用场景往往需要独立的架构设计与调参,效率相对较低。“小作坊式”的AI开发模式在一定程度上限制了生产力。
华为云CEO张平安 图片来源:官方供图
从华为盘古大模型的进化路径可以看出,主要分为L0、L1、L2三个阶段。L0指基础大模型,L1是在L0基础上导入行业数据进行训练后衍生出的行业大模型,L2是在L1基础上结合行业细分场景得到的推理模型,上层是在下层的基础上演化而来,层层递进。国金证券认为,华为盘古大模型是一种工业化AI开发的新模式,可以解决小模型的定制化难题,使一个模型应用到多个场景中。
具体来看,其中,L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,包括NLP(自然语言处理)大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力。
L1层是指N个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务、金融、制造、矿山、气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上,为客户训练自己的专有大模型。L2层则提供面向各行业中更细化场景的模型,如先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景等。
公开资料显示,华为盘古大模型于2020年启动研发。2021年4月,华为发布了NLP大模型、视觉大模型和科学计算大模型。此后,盘古大模型在性能、深度、架构方面及数据增强方面持续升级。当前,盘古大模型的核心定位是为各行各业赋能。
会上,张平安分别介绍了盘古大模型在金融、金融、制造、医药研发、煤矿、铁路等诸多行业发挥的价值。
例如,在煤矿领域,盘古矿山大模型已经在全国8个矿井规模使用,一个大模型可以覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景,让更多的煤矿工人能够在地面上作业,减少安全事故;在气象领域,原来预测一个台风未来10天的路径,需要在3000台服务器的高性能计算机集群上花费5小时进行仿真。现在基于预训练的盘古气象大模型,10秒内就可以获得更精确的预测结果。
张平安表示,华为的盘古大模型不会写诗,只会做事。它要帮助各行各业,在各个领域都要让AI来赋予它们价值。比如金融、矿山、政务,有很多工作小组都派下去。“我们一直坚持的方向就是‘AI for Industries’”
每日经济新闻