传统AI时代,终将过去?

转载
499 天前
6564
虎嗅网

文章转载来源:虎嗅网

作者:五方

来源:虎嗅

图片来源:由无界 AI工具生成

生成式AI掀起巨大声势,而它自身也不断展现出越来越大潜力。比如让AI自动设计芯片,或者让AI给人看病。

为抢占领先地位,趋之若鹜的企业不仅使出浑身解数,释放自身技术力,AI模型也越做越大,以达到力大砖飞的效果,实现智能涌现(emergence)。

科技部新一代人工智能发展研究中心的《中国人工智能大模型地图研究报告》显示,迄今为止,中国已发布79个10亿参数规模以上的大模型,大模型之战逐渐步入后半场,更多人开始关注大模型与实体产业的结合上,企业也接连展示其产品的应用场景。

但平心而论,原本使用传统AI技术的应用,真的需要使用大模型吗,什么样的大模型才是行业所需的?华为开发者大会2023(HDC.Cloud 2023 )上,华为云展示其在“AI for Industries”、盘古大模型方面的最新进展,并提出让AI重塑千行百业。


行业大模型成新风向


任何企业都不想在大模型热潮中掉队,你方唱罢我登场,近几个月每隔几天都会有一个大模型的新闻。市场轮转下,企业已纷纷从抢占先机,上马通用大模型,逐渐谋局落子,转向行业大模型,尽显自家产品实用性,其中不乏实机演示和方案展示。

大模型之所以被大众所熟知,是因为ChatGPT这样to C的产品,让人实实在在体会到技术的价值。实际上,大模型的关键不在于有多大,或是通用能力有多强,而在于能不能解决现有应用的问题,只有立足应用本身,重塑千行百业,改善提升人们生活品质,才能被人所接受。

纵观全球,因算力成本高昂、信息泄露、政策监管等挑战,大模型的to C商业化进程更为缓慢,大多企业选择务实地面向to B端企业客户落地,满足特定行业场景所需要求。可以说,做行业大模型已成普遍共识。

传统小模型AI通常只能执行特定任务或特定问题,对to B行业而言,大模型不仅可以将传统系统信息串联在一起,还可实现更为复杂的决策和规划。

但做行业大模型谈何容易,许多想要应用AI的企业,最终都只能作罢。

首先,企业业务场景复杂,且多数需定制化,要对文本、图片、音频、视频、机理等多样化任务进行处理,与之相悖的是,大多企业稀缺数据样本。

其次,大模型是烧钱的游戏,不仅要在训练阶段使用千卡起步的大算力,还需技术力极高的专业AI应用开发人才。

最后,数据和知识是企业核心资产,需保证企业数据的隐私安全及合规。

专业的事,就应该交给专业的人来做,大模型亦如此,而不是让企业与去制造螺丝、轴承、齿轮这样的基础性工作。

华为云作为早在2021年就发布盘古基础大模型的企业,在大模型领域绝非新手,彼时便以AI工业化为目标。而到今天,华为云正式发布盘古3.0和昇腾AI云服务,成为中国首个全栈自主的AI大模型,坚持AI for Industries方向,让AI和各行各业深度结合。

就如华为常务董事、华为云CEO张平安发所提到的,盘古大模型不作诗、只做事,聚焦行业场景,致力于深耕政务、金融、制造、煤矿、铁路、制药、气象等行业。


以大代小引发的改变


事实上,大模型早已脱离讲概念的阶段,而是正在悄然改变生活中的一切。

气象与人类密不可分,而它也为我们的发展之路上带来许多损害。就比如,每年,全球大约会生成80个台风,其中影响西北太平洋和南海的大约有25个,平均有7个会登陆我国。2022年,台风灾害造成的直接经济损失54.2亿元。

传统气象预测多采用HPC高性能计算机计算,如要预测台风未来10天路径,需在超级计算机上,利用超过3000个节点的超级计算机上花费数小时进行仿真。随着算力增长趋势和物理模型复杂化,传统数值预报瓶颈凸显。

盘古气象大模型则只需单机单卡,10秒内就可完成一次气象预测。它是全球首个精度超过传统预报方式的AI模型,可在秒级时间内完成一个台风未来10天的路径,台风路径预测准确度世界第一,相比欧洲气象局提升约20%。

同样的改变,发生在制药领域。

抗生素曾挽救无数人生命,但自1987年达托霉素被发现以后,人类已有近40年没有发现新的抗生素。耐药性不仅会威胁每个人的身体健康,还可能会导致到2030年GDP每年下降至少3.4万亿美元,使2400万人陷入极端贫困。世界急需全新类别的抗生素,改变病人面对“超级耐药菌”感染时无药可用的局面。

研究一款新药谈何容易,一直以来,新药研发难逃“双10定律”魔咒,即平均成本超过10亿美元、研发周期大于10年。不止如此,这还是最佳的业态,现实中一款新药从研发到获批上市,平均需要10年~15年时间,耗费超过26亿美元,且临床成功率不到10%。

华为云盘古药物分子大模型采用全新深度学习网络架构,生成了1亿个100%结构新颖的类药小分子库,相比传统方式,成药性预测准确性可提升20%。

西安交通大学第一附属医院刘冰教授在新药研发中采用基于华为云盘古药物分子大模型打造的AI辅助药物设计服务,研发出一款超级抗菌药Drug X(肉桂酰菌素),有望成为近40年来首个新靶点、新类别的抗生素,并将先导药的研发周期从数年缩短至一个月,研发成本降低70%,打破医药界“双十定律”。

被改变的,不止是患者。

幽暗的矿山之下,是工人的人生。下井工人长期处于高危高压环境,不仅被死亡阴影所困,更是伴随着一生的伤病。但与之相悖的是,当前300米井下仍需大量人员现场作业,他们更需技术的人文关怀。

AI就是保障井下作业安全的好手,能够让不确定的人工流程多一个好帮手。然而,要AI进入煤矿行业并没有想象那样简单。井下作业环境恶劣,对图像、视频识别精度要求高。况且,矿山与矿山间差别大,现场作业情况复杂,模型不可能简单复用。同时,煤矿行业缺乏高素质的人工智能人才。

盘古矿山大模型只需导入海量无标注的矿山场景数据进行预训练,即可进行无监督自主学习,一个大模型就能覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景,能够实现全时段巡检,帮助工作人员及时发现问题,避免因漏检造成的安全事故,缩短停机时间,同时提升井下巡检人员的工作效率。目前,它已在全国8个矿井规模使用。

无数大中小城市因铁路而串联,迄今为止,我国铁路营业里程15.5万公里,铁路货车超过100万辆。随着我国铁路安全水平提升,很多故障已极少发生,多数人都没有见过,但故障一旦发生通常都是大故障。比如摇枕心盘脱出,全国范围内只找到一张故障样本。

安全的背后是无数人的辛劳。受制于技术发展,当前广泛采用的TFDS(货车运行故障动态图像检测系统)仍采用人工方式进行故障识别。以某枢纽站5T检测车间为例,日均检车近800列4万余辆,TFDS系统拍摄图片280万余张,列检员每天需检查大量极其类似的图片,且需在5秒左右的时间及时发现细微的差别,找出列车存在的故障。

通过盘古大模型,原来人工需要识别4000张图片,现在仅需要复检170多张图片,工人劳动强度下降95.75%。实际应用中,能精准识别67种货车430+种各类故障,重大异常故障100%识别,无故障图片筛除率高达95%,超过客户预期。

这样的例子不胜枚举,事实上,每次使用一网通办业务,每次使用智能产品的背后,或许都是大模型的功劳,我们也一直在直接或间接地享受到技术升级所带来的红利。


盘古大模型又有何不同


如今的大模型领域,依然热得发烫,国内选手上演了一出”百模大战“,其中不乏实力强劲的互联网大厂,那么盘古大模型又有什么差异化优势?

首先,华为云在AI领域已有数百个项目,并坚持AI for Industries,结合自身超过30年行业积累经验及10余个行业军团持续场景深耕,将行业客户和伙伴沉淀的丰富的Know-how与大模型进行融合,让大模型具备行业知识与经验。

其次,盘古大模型除了学习大量通用知识外,还学习了10多个行业公开数据,涵盖金融、政务、气象、医疗、健康、互联网、教育、汽车、零售等。

更为重要的是,盘古大模型从底层芯片到全流程平台都实现了自主创新。要知道,AI热潮中,GPU已成为炙手可热的香饽饽,但在地缘政治摩擦和供货短缺多重影响下,部署高性能计算卡只会困难重重,因此,自主创新已成行业普遍共识。

回顾盘古大模型历史,是不断满足行业需求的过程。2020年3月,田奇加入华为云后便开始组建团队;2021年4月,盘古大模型正式对外发布,包括NLP大模型和CV大模型;2021年9月,华为云发布科学计算大模型和药物分子大模型;2022年6月,华为云发布盘古矿山大模型;2022年11月,华为云发布气象大模型。

时间回到现在,华为云正式发布盘古大模型3.0,同时发布政务、金融、制造大模型。大模型在前一阵子异常火热,为什么华为云要选择这个时间点公布盘古大模型的进展?

事实上,华为云在面对产业新技术和新趋势时,优先考虑的都是行业需求,只有当技术做得足够成熟才会向市场推行新技术。而从盘古大模型3.0上来说,此次华为云更为明确了其产品在工业上的定位,整合了以往的大模型,重新梳理架构,并通过新的大模型把这张网拉的更大,以覆盖到每一个行业。

华为轮值董事长胡厚崑在日前的2023世界人工智能大会上也强调,人工智能的发展,关键是要“走深向实”,赋能产业升级。当前阶段,华为在人工智能发展上有两个着力点:第一,打造强有力的算力底座,支撑中国人工智能产业的发展。第二,从通用大模型到行业大模型,让人工智能服务好千行百业、服务好科学研究。

盘古大模型3.0采用分层设计,包括5+N+X三层架构:5大L0层基础大模型提供各种通用技能,N个L1层行业大模型帮助企业打造自己的大模型,海量L2层场景模型专注于具体应用场景或特定业务,为客户提供开箱即用的模型服务。

算力是大模型的食粮,训练过程中,盘古各个系列大模型几乎都需要几百张、甚至上千张昇腾芯片训练,昇腾AI云服务则是盘古大模型的底座,为它提供坚实的基础。

华为云单集群达2000P Flops算力的昇腾AI云服务在乌兰察布和贵安同时上线,采用天成液冷平台的华为云数据中心能够保障千卡训练30天长稳率达到90%,断点恢复时长不超过10分钟。

“为了帮助全球客户、伙伴、开发者训练和使用大模型,我们致力于为全球客户打造世界AI另一极,为所有AI开发者提供新的选择”,张平安如是说。

对很多企业来说,数据安全合规是首要考虑因素,盘古大模型除公有云部署模式,可进一步提供大模型云专区,建立云专属资源池供大模型训练和推理,确保数据安全合规。对于更严格数据本地化要求,还提供混合云部署,帮助客户在自己的私有化HCS上训练大模型。

一款产品,好用才是关键。华为云提供了易用可靠的大模型工具套件、汇聚海量多行业场景API的开天aPaaS,以及包含丰富优质课程和技术认证的大模型专属社区,以帮助开发者快速开发。

诚然,技术本身是革命性的,但对盘古大模型进入千行百业这件事,仍然需要给它时间在行业中生根发芽。

正如AI四大天王之一的Andrew Ng所说,“很难想象哪一个大行业不会被人工智能改变。大行业包括医疗保健、教育、交通、零售、通讯和农业。人工智能会在这些行业里发挥重大作用,这个走向非常明显。”未来,每个行业或许都会由各个行业大模型所改变。