百模大战,不拼单项拼平台

转载
386 天前
8419
数智前线

文章转载来源:数智前线

原文来源:数智前线

作者:徐鑫

图片来源:由无界 AI生成

产业智能化转型走进深水区,企业对AI能力的需求点在起变化。

越来越多大型企业的视野已不局限在单一智能应用上。在电力、金融等行业,大型企业正围绕着AI能力的生产、运用和管理全流程,对厂商的AI学习平台及平台性生产力工具提出需求,从而解决人才稀缺、数据稀缺、管理困难、资源复用率低等一系列痛点。

大模型热潮到来后,平台的比拼重点转移到了大模型开发和应用之上,厂商们积极将此前的AI平台解决方案和大模型结合。 在平台大比拼中,一些企业的优势已经凸显出来。国际分析机构Forrester近日发布报告显示,中国人工智能/机器学习平台竞争中,百度智能云表现亮眼,参与评选的AI平台在数据、推理、应用等6个大类,15个细项获得了最高分,位居领导者象限

AI平台,正帮助企业快速构建符合业务需求的人工智能模型及应用,有效监控和优化模型效果。

一百个场景要建一百个模型的境况已经成为历史。


01 深度用AI,老炮们的困扰


产业正在进入深度用AI应用阶段,AI已不再遥不可及。不过也有越来越多企业发现,随着应用深入,这些企业智能化领域里的资深用户们正在遭遇新的困扰。

以能源行业为例,大型电力企业已经将AI模型用于电路巡检等多个场景。通常情况下,这类企业的相关需求,多由不同部门或分公司独立采购。随着AI应用变多,模型数量也在积累。管理大量模型,并让大量的零散模型能稳定、高效运行,正成为一项挑战

许多大型企业都存在类似问题。一位资深人士告诉数智前线,他亲眼见过企业里A部门放5个人做A算法,B部门搞B小分队也放几个人做算法,这导致很难从公司层级进行统一的监控优化更新维护,同时企业内整体的AI资源复用率很低。

金融行业应用AI也走在前列,一些企业或机构早已将AI技术应用于信用卡发放资格审批和欺诈识别等多个环节,实现AI风控和精准营销。但金融行业对安全和合规的强调也在延伸到AI的应用过程。比如,银行内的技术团队非常重视合规因素,新建一个模型时,建设的委托和批准角色是谁,数据读取的审批由谁经手,数据撰写、模型生产、训练、落地和上线也都有层层流程保障。这类需求明显不是传统的智能应用建设。

一位云厂商资深行业解决方案人士告诉数智前线,一些大型央国企明确提出希望构建企业的智能中枢,培育自身的AI能力,这样企业里的数字化部门就能针对新场景,自己研发算法做全新应用。

业界也观察到这一趋势。百度智能云AI平台高级架构师靳伟告诉数智前线,这反映出,AI应用迈向深水区,企业的智能化转型的系统性日益凸显。企业不但要有愿景目标规划,也需要有很强的推进协调和监督机制,并且要有完备的工具,确保顺利推进实施。AI平台就是企业智能化转型的生产力工具。

行业上下已经意识到这一平台产品的重要性。日前,国际分析机构Forrester发布《The Forrester WaveTM:中国市场人工智能/机器学习平台厂商评测,Q42023》报告指出,中国的企业决策者们正进一步优先考虑采用AI技术,推动生产率提升和业务创新。过程中,企业需要人工智能平台产品,从而在各自的业务环境中支持复杂用例

新的趋势对机器学习平台厂商的能力也提出了要求。Forrester认为,领先的平台既要能提供跨数据管理、模型培训和人工智能应用程序构建的综合工具;也要贴合产业场景,帮助一些缺乏AI人才和数据科学家的企业基于自身业务需求来获得AI能力;另外,还能通过工具、技术和实践帮助企业可以规模化开发部署模型。

Forrester对中国14家主流机器学习平台厂商从产品能力、战略布局、市场表现3大维度,进行了25项细分标准的评估。数据显示,目前百度智能云获评该报告的领导者阵营,在数据、训练、预测推理、应用等9项细分评分均获第一。

靳伟介绍,百度在AI平台的产品能力领先经历了长期的积累和打磨。AI平台的初衷是希望打造一款生产力软件,让不同类型的企业用户能够多快好省地建设AI应用,同时做到平台上算法多、工具多、运行快、效果好,帮助客户节省服务器和人力。

目前能源、金融行业的一些大型企业里已经在深度使用。基于AI平台,企业不仅可以快速构建符合业务需求的人工智能模型及应用,还能有效监控和优化模型效果。此外,管理和协调数据、算力、人员、流程等资源时也更便捷、高效。

例如,电力行业,百度智能云AI平台正帮助大型集团解决业务痛点。一方面,模型和数据能在不同子公司分享,避免重复造轮子。同时一些已有的安全生产相关模型使用这款产品,可由国网直接统一分发到省网或市网,能高效利用AI资源,质量一致。另外,AI平台还能助力企业创新,比如研发出的电力调度新算法,用上了百度的强化学习框架,可实现不用大量专家的人工经验调参数,AI自动完成调度参数校准。

金融行业里,百度智能云的AI平台解决方案也帮助许多金融机构构建了大的模型风险管理模块,保障AI应用到金融场景里流程合规和可信安全。


02 大模型时代,如何量体裁衣


今年以来,大模型和生成式AI浪潮推动了产业界进一步深度应用AI,机器学习平台也在迎来新的发展机会。

资深人士介绍,大语言模型到来后,机器学习平台的变化体现在三个层面。最典型的一个变化在操作界面上,NLP之前复杂的操作界面变简单了,企业应用语言类AI的门槛在降低。同时,模型的自动化能力提升,数据处理、模型选择、自动报告生成等任务都可以自动化完成。另外,AI原生的创新应用空间也随之打开。

在这一背景下,许多企业已经把大模型当作了一道必答题,各平台厂商也摩拳擦掌,加足马力,推出各类产品和平台来加速大模型技术的应用落地。以百度为例,今年3月推出了百度智能云千帆大模型平台,将大模型开发和应用的关键能力与AI平台深度整合,打造大模型服务的“超级工厂”。

为方便企业轻松使用和开发大模型应用,目前百度千帆上既提供包括百度自研的文心大模型和第三方大模型,还提供了各种AI开发工具和整套开发环境,助力各行业的生成式AI产业落地。

具体而言,百度将产业界对大模型的需求总结为五种类型,无论是只有算力需求的客户,还是希望直接调用大模型API或基于现有大模型做二次开发的企业,以及想要基于大模型去开发AI原生应用或者直接使用已开发好应用的公司,百度千帆平台都能提供有针对性的服务。

对只有算力需求的企业,百度千帆平台可提供极具高效和性价比的异构算力服务。靳伟透露,要做到这一点,百度智能云AI平台的技术团队花几年时间做了大量Dirty Work。例如兼容国内外主流AI芯片,需要从框架层、核心算法及网络、芯片型号、操作系统四个层级做适配。“PyTorch写的和TensorFlow写的不一样,操作系统用Windows、Linux或者单片机,要做的工作也有差别。四层组合做了四万种适配,才能保证各种模型顺利运转。”靳伟说。

想直接调用大模型API的用户关心模型能力的丰富性,目前千帆大模型平台既接入了文心大模型4.0,还纳管了44个第三方的国内外主流大模型,数量上是国内平台里最多。

有些企业希望对现有大模型进行二次开发,这需要丰富的工具链和大量的数据集支持。千帆平台目前有覆盖大模型再训练、微调、评估和部署等全生命周期的完善工具链和大量高质量数据集,能针对场景快速优化模型效果,进一步提升企业的大模型用户体验。

大模型对数据标注环节带来新变化,许多标注任务可通过模型完成。目前千帆平台支持业务数据回流和高度自动化的数据标注。比如目标检测场景里,千帆直接提供预训练能力,通过点按纽标注少部分,剩下的让模型学习人类标注风格自动标注,可为企业节省70%~90%的人力。

有许多企业想基于大模型来开发AI原生应用。本月中旬,百度智能云发布“千帆AI原生应用开发工作台”,其中包含大模型应用开发的常见应用组件、应用框架两层服务,正是针对开发AI原生应用需求。

以应用组件为例,千帆平台包含了多种类型的能力,如问答、思维链等大语言模型组件和文生图、语音识别等多模态组件以及向量数据库、对象存储等传统云服务能力等。

而应用框架能将组件有机串联起来,完成特定场景的完整任务。千帆平台已经提供市面上常用的检索增强生成(RAG)、智能体(Agent)等框架服务,先锋企业如三一重工已经应用这些框架,快速开发自己的知识问答应用。

Prompt工程是大模型出现之后诞生的新领域。这与大模型的特性有关,稍微改变一下指令,它的输出或行为会发生巨大变化。目前,各家厂商都在强调Prompt工程工具。百度千帆平台也提供了覆盖对话、编程、电商、医疗、游戏、翻译、演讲等十余个场景,共226个模版。据介绍,这是国内主流平台里数量最多的Prompt模板库。开发者和企业还能使用平台提供的各类自动化及批量工具,高效完成prompt环节。

靳伟认为,过去几个月里百度智能云千帆大模型平台夯实了基础,为百模大战,助力企业规模化应用AI做好了准备。


03 AI平台,下一站拼什么?


AI并不只是大企业专属。目前机器学习平台厂商们都重视对大型企业、中小型客户和开发者市场的全面覆盖,百度智能云的AI平台解决方案也有针对性地服务不同群体

靳伟告诉数智前线,百度AI平台解决方案是多个产品的总称,包含了全功能AI开发平台BML、零门槛AI开发平台EasyDL及百度智能云千帆大模型平台等产品。针对不同领域或不同客户偏好,AI平台都有对应的产品适配。例如,数据处理能力被打包成EasyData产品,零代码建模能力也被抽出来做了EasyDL产品,能帮助用户实现用高性能预训练模型完成零代码建模,而大模型的能力则由百度智能云千帆平台承载。

在公有云上,客户类型以偏中小的企业居多,AI平台的模块被重新打散组合,以全功能AI开发平台BML和EasyDL产品为主要代表来适应需求。针对大型客户的私有化部署需求,各类产品又会被打包成超大产品去完成交付。

此次Forrester报告显示,百度智能云AI平台的产品能力在数据处理、模型训练、预测推理、应用、架构等五大领域都表现优异。

靳伟介绍了不同领域里的独特能力优势。以数据领域的特征工程为例,靳伟介绍,百度AI平台集成了非常优异的特征库管理能力,能力上达到了专业级水平。可以提供特征的增删改查,特征生产、共享、版本管理、数据验证等功能,支持批示流式不同形式的数据用于预测服务,还能保证模型训练时用的特征和最终预测时候的特征一致。“如果训练的时候特征分布上,比如男人占50%,女人50%,而预测的时候男人占60%、女人40%,那你不可能指望这个模型特别准”,靳伟说,这对模型的准确性非常关键。

又比如模型训练领域,百度AI平台可支持包含图像、视频、文本、语音以及结构化数据等多种数据类型的建模和训练。在建模方式上,为愿意写代码的人提供了NoteBook工具支持,不喜欢写代码的人能拖拉拽甚至点一下集成式一站式按纽就能建模。针对大量的场景比如图像分类,单标签多标签,物体检测等CV场景,都由飞桨算法团队基于Paddle算子进行了深度优化,性能和效果表现会更优异。

产品性能上的独特优势点,离不开长期的技术投入和对新技术趋势的关注。百度AI平台研发团队介绍,他们非常关注新的技术趋势,比如三年前业界就在探讨模型可解释性问题,不知道模型怎么做决策的,就会影响模型在安全合规要求比较高的场景里使用。一般而言,深度学习模型参数量上比传统的机器学习模型大很多,黑盒问题会更加严重。

经过长期的准备,百度AI平台团队最终攻克了常规机器学习领域下的模型可解释性算法,集成了五个常见的机器学习的原理白盒化,同时还攻克了部分深度学习可解释性问题。“弄清模型在什么场合下做出决策,是数据引发还是算法引发,都可以归因,这些成果推动了AI平台相关产品在金融决策等特殊行业场景里的应用。”靳伟介绍。

当下业界把大模型的发展范式分五层,大模型本身、prompt工程、Chain工具链和行动链、Agency与Multiagency。百度智能云千帆平台此前主要的工作重心在第一、二层走得非常扎实,后面三层包括工具链、Agent和Multiagency能力也处于重点建设阶段。靳伟介绍,千帆大模型平台将持续完善升级,让大模型自主发挥主观能动性,具备解决复杂问题的能力。同时,未来不排除有出海计划

总体而言,企业智能化建设下,企业应用AI深度升级,AI平台领域的竞争也日趋激烈。要在这一领域持续保持领先,迎接合规性和技术复杂度变化等带来的长期挑战,厂商们还需要技术投入。靳伟认为,厂商需要坚持技术创新、在客户满意度、安全性、合规性上提升来适应这个不断变化的市场。