通用大模型商业化尚早,生成式AI才刚起跑

转载
476 天前
3103
智能派

文章转载来源:智能派

来源:钛媒体

作者:秦聪慧

图片来源:由无界 AI生成

从狂热追捧到回归冷静,人们对大模型看法正在悄然发生转变。一方面,由于合规、监管等原因,通用大模型商业化尚需时日;另一方面,产业侧才从金融、医疗等试点领域着手投入,效果上也并不能立竿见影。

于是,当疯转的螺旋逐渐变慢,不同的声音逐渐描绘出一个真实的“大模型”图景。

这其中,究竟是上“通用大模型”,还是上“行业大模型”,各家也都在经过一番考量后做出了选择;而伴随大模型之争,“生成式AI”进入聚光灯下。不得不说,ChatGPT无异于是人工智能行业发展进入新阶段的一针强心剂,它将AI重新推向了时代中心。


通用大模型与行业大模型之争


ChatGPT让业界认识到了通用大模型的巨大能量,这才有了后面“百模大战”的商界奇观,无数投资人、创业者为此夜不能寐,GPU资源也一时变得“洛阳纸贵”。

这其中,不乏一些行业头部的技术公司被逼上“梁山”。一位大模型业内人士就曾对钛媒体App透露其公司所处现状:“没有大模型都不好意思出来讲,现在做吧,赶了个晚集,说没有又不好交代。”所以他们只能一边对外界放出正在做通用大模型的消息,一边内部加紧研发进度。

但通用大模型毕竟是一件费时费力的苦差事,OpenAI将GPT1.0迭代到4.0用了6年,百度文心一言、智源悟道等业界反馈较好的通用大模型也都是从几年前就开始着手训练。因此如果在AI技术和数据等方面没有基础积累,想要在短期内实现通用大模型的商业化是非常困难的一件事。

再加上通用大模型天然需要公开数据做训练,把自身数据投入通用大模型也意味着默认将数据共享。所以,一些对数据隐私要求高的行业,也不太可能在毫无准备的情况下接入通用大模型。

在这一境况下,行业大模型成为业界在通用大模型之外,“退而求其次”且能较快享有大模型红利的方案。360集团创始人周鸿祎也曾直言:“人工智能大模型未来机会在企业级增量市场,大模型是‘垂直化’是发展方向。”某大厂技术高管也对钛媒体App表示。“从我们在大模型的规划上来看,持续迭代通用大模型,并以此继续分层,进行行业垂直大模型训练。”

不久前,在2023 世界人工智能大会上,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生也表示,企业的大模型应用需要综合考虑行业专业性、数据安全、持续迭代和综合成本等因素。基于行业大模型,构建自己的专属模型,也许是企业更优的选项。原因是,行业大模型所需参数比通用大模型少,训练和推理的成本更低,模型优化也更容易。

不过,钛媒体App也从以为行业人士处获悉,在一些情况下,通用大模型也不是垂直大模型的必要条件,也就说一家训练行业大模型的平台不必须以通用大模型为底座。“如果定义的通用大模型是千亿参数那种,那么通用大模型不是行业大模型的必要条件。”在一次交流中,一位行业大模型高管向钛媒体App表示。不过,他也表示,通用大模型虽然不是行业大模型的必要条件,但是训练通用大模型的各类底层技术,如Transformer等,却也是训练行业大模型必不可少的要素。

不动辄“千亿”参数,“撇清”与通用大模型的关系,垂直大模型的门槛也进一步降低,这给生成式AI的进一步发展提供了更多可能性。


大模型之外,生成式AI也值得关注


每当谈及大模型,生成式AI(Generative Al)就会如影随形。简单来理解两者的关系——大模型可以理解为实现生成式AI的引擎,即生成式 AI 的能力由机器学习模型或者大模型提供,而生成式AI比大模型更上层,生成式AI可以根据所需场景可以决定调用哪种大模型,ChatGPT是生成式AI的典型应用之一。

早在2020年,生成式AI就入选了Gartner新兴技术成熟度曲线,2022年,生成式AI被列入主要战略技术趋势之一,该技术已从创新触发阶段进入膨胀期望的峰值。Gartner认为生成式AI将成为一种通用技术,其影响类似于蒸汽机、电力和互联网。随着生成式AI逐渐落地,围绕这一概念的炒作将会逐渐消退,对人和企业在日常工作和生活中影响将会增加。

图片来源@Gartner

全球云计算巨头亚马逊云科技也是将笔墨更多地放在了生成式AI身上,亚马逊云科技首席执行官Adam Selipsky曾接受Bloomberg、CNBC等媒体专访时表示:“生成式AI在聊天机器人和搜索上的应用优势已经有目共睹,但这只是众多可能性的冰山一角。未来,生成式AI将为各行各业带来变革。”他把生成式AI看做一次“突破性”变革,且有可能是自互联网诞生以来最大的变革。

“想像一下,在计算机以穿孔卡片为交互界面的年代,只有少数科学家才有能力使用计算机;当图形界面和鼠标成为人机交互界面,人人都可以使用计算机。”Adam Selipsky表示。

那么,生成式AI带来的变革会体现在哪些方面呢?

可以看到,在汽车领域,已经有企业使用生成式AI合成数据用于自动驾驶训练,加快训练进程;在制造领域,生成式AI可以帮助分析大量物联网遥测数据,进行预测性维护,减少生产线的停机时间。依托生成式AI,Autodesk与飞机制造商合作,成功完成了舱壁的部分设计,并推出了重量减轻45%的新设计。如果将这种航壁推广应用到全球机队,将可以节省相当于93000辆汽车油耗的燃油。

不过需要强调的是,Autodesk所依托的生成式AI背后并非是某某大模型,而是以机器学习模型构建的AI驱动的设计工具。

所以,对与生成式AI的实现来说,大模型只是一种选择,未来也不会是以一个大模型为主导。钛媒体App关注到,大多数企业在考虑接入大模型时,并不仅仅直接入一家大模型,而是选择接入多家。那么这多家大模型中,未来可能也不排除垂直大模型和通用大模型的通力合作。

以国内两款软件用友和WPS为例,用友日前发布企业服务大模型YonGPT,据钛媒体App了解,YonGPT规划接入的通用大模型底座包含智谱ChatGLM、文心一言以及智源悟道天鹰等;WPS此前推出了WPS AI,据最新消息,WPS AI在中国内地依托的通用大模型底座为MiniMax,其刚刚推出的海外版本则是由OpenAI和PaLM2提供大模型支持。

在生成式AI的世界中,不依赖一种大模型,而决定生成式AI是否成功的也并不只有大模型。

不可否认的是,生成式AI的落地也多方面促成的结果,且围绕生成式AI落地而出现的“次生”挑战正在暴露出来。


生成式AI下“次生”挑战


“对着手机说‘如果猫跑到沙发上,提醒我’,那么在猫跑到沙发上的时候,手机就会收到告警信息。”视频解决方案服务商山东中维世纪科技股份有限公司高级副总裁王正彬在一次演讲中提到了智能家居的智能视频检测应用场景。

但就是这样一个看似简单的场景,除了背后的多模态大模型,边缘端的网络、计算也非常重要。“像ChatGPT这样的生成式AI应用中,如果网络丢包率达到1%的时候,大模型训练平台的性能就会掉到它峰值性能的5%,也就是说95%都丢掉了。网络能力对整个大模型平台的性能是非常重要的因素。”英特尔中国区网络与边缘事业部首席技术官、英特尔高级首席 AI 工程师张宇说道。

有预测认为,随着AI需求的爆发,人工智能的在边缘端的部署,将会比在数据库当中高3倍,这也意味着边缘端AI的落地是下一步人工智能发展的一大挑战。

“人工智能部署到工厂产线等边缘端的时间成本和人力成本还是偏高,且边缘人工智能的部署超过一半都是失败的。”英特尔公司高级副总裁兼网络与边缘事业部总经理Sachin Katti 日前谈到大模型时代下的边缘计算问题时表示。原因一方面是设备陈旧,边缘计算资源不足;另一方面,如何利用他们自身独特的数据来部署 AI 也非常关键。很多边缘 AI 的部署会因为这些挑战止步不前。

同时,生成式AI的更好表现最终也需要依靠数据来支撑,目前业界一方面希望能保证生成式AI中的数据安全,一方面也希望能够实现数据源能够丰富可用。

这些问题的解决,也已经在逐步推进中。“今天的大模型体系、AI体系是强依赖数据的,是数据驱动的智能体系。这个体系对数据所需要的广泛性和无偏差性要求非常高。假设数据偏差性非常大,很难有效支撑人工智能体系发展。”蚂蚁集团副总裁兼首席技术安全官韦韬曾表示,于是可以看到,目前已经有反向验证AI数据安全的工具出现。

在开拓数据源上,不久前,深圳数交所联合近50家单位成立“开放算料联盟”,共同发起机构包括了腾讯云、华大基因、云天励飞、奥比中光、优必选、中国联通广东分公司、华傲数据等企业,深圳市人工智能学会等协会,国家超级计算深圳中心等智库及研究机构。该算料联盟成立的一个主要目的,就是围绕高质量中文训练数据和多模态训练数据,协调数据要素、数据治理、训练数据、数据标注、合成数据等相关标准制定,协助数据交易所增加大模型相关的新品类和新专区。

生成式AI在发展过程中所遭遇的挑战并不能一文言尽,ChatGPT引发的全球AI风暴也并不以ChatGPT而结束。在新人工智能世界被打开后,处于初级阶段的大模型与生成式AI也暴露了诸多问题并抛出了一系列挑战,但同时这给各行各业提供了探索和创新的机会。

行业竞逐生成式AI,这对人工智能甚至是人类的发展来说绝非是一件坏事。