大模型扎根产业:从“能力涌现”到“价值涌现”

转载
490 天前
5651
AIGC

文章转载来源:AIGC

原文来源:亿邦动力

图片来源:由无界 AI‌ 生成

从2023年初吹响的人工智能AI“大乐章”,最近却不再是那么“悦耳”,而是夹杂着噪音和质疑。

比如,流量之争。

海外调研机构Similarweb的数据显示,OpenAI一路高歌猛进后,从5月份开始,流量增长趋于平缓。6月份ChatGPT的访问量,甚至首次出现了环比下降,幅度为9.7%。有人根据这个数据说,AI又要凉凉了。

但也有舆论认为,调研的流量仅为C端数据,而AI目前的发力在B端。B端的流量甚至超过了目前总流量的一半,而且攀升很快。只是调研机构没有拿到完整数据。

流量到底是短期波动?还是长期下降?或者真的是侧重不同?

再比如,热情之假。

经纬创投合伙人张颖,分享了两个对比起来颇有意思的数据。一个是今年3月到5月,标普500指数的公司中,有110家公司的高管在业绩交流会上提到了AI,这是过去十年同类型数据的3倍。

但另一组差异的数据是,国际投行摩根士丹利最近做了一个2000多人的调研,结果竟然有80%的人,没有用过ChatGPT或是谷歌的Bard1。

这个数据对比起来,颇有“叶公好龙”的感觉。难道这些企业高管、科技大佬、分析师们的热情是假的吗?

又或是,用户之惑。

C端用户的热情很高也很真,但在使用之后,却产生了疑惑:我们希望机器人帮人类扫地洗碗,是因为人类要去写诗作画。结果,现在是AI都去写诗作画去了,我们人类还在扫地洗碗。

难道人工智能的“涌现”,就不能照进现实世界吗?

流量之争、热情之假、用户之惑,这些争议也直击大模型发展的核心要素:如何真正成为生产力?

解答思路的不同,会塑造不同的AI发展体系,也会成为企业未来发展的分水岭。


01 从算法到产品


人工智能从诞生之日起,就不断壮实“两条腿”来走路:一条是技术,一条是应用。

AI技术提高的背后,是算力、数据、算法三大要素的共同支撑。比如算法方面,人工智能先后经历了规则、统计机器学习、深度学习、预训练等阶段,从而将数据量大幅扩大;而“开天辟地”的算法Transformer,通过注意力机制,让AI通过“做题”的方式快速训练,从而展现出了显著的突变性、更强的自主学习能力。

技术的每次跨越都会带来惊喜,但如果回顾人工智能发展历史,会发现,数次惊喜过后,都留下了落寞。

比如1956年兴起的热浪中,人工智能会下西洋棋、会抓积木,但在1973年时,学术界一份报告总结到:到目前为止,该领域的任何发现都没有产生当初承诺的重大影响2。

1976年,基于AI的专家系统,开始参与医疗诊断咨询。热浪再起,各国政府加大投资。然而又十年之后,人们发现,机器专家也并没有展现出什么才华。医生还是要亲自上、不够用。

2016年起,谷歌AlphaGO在围棋界挑战人类多位棋王,曾5天取得60连胜。哪怕李世石、柯洁也只能投子认输。人们感叹人工智能的强大,但此后5年,AI也并未再有惊叹之举。

起伏之间的转折要素,正是“产品”:有没有好产品,让技术走下高坛、走进社会,真正成为生产力、创造力

技术和产品互促关系的案例并不少。比如失败案例有摩托罗拉的铱星计划,提供全球卫星通信服务,技术领先但因为产品不接地气,正式运营了4年就宣布破产了。成功案例有电动车,虽然电池、电驱动都是已有技术,但只有当科技感十足的产品出来后,市场才逐渐打开。

回到大模型领域,在这一轮AI大潮有一个有趣的点:OpenAI发布了全球爆火的ChatGPT,用的却是谷歌的Transformer算法,进行不断优化。这就说明,在这一轮大模型竞赛中、人工智能浪潮中,仅有算法并不够。只有算法,是单薄的;算法的单点竞争,终究要让位于“产品之争”。

而OpenAI也并非是“醉心技术”,在它的背后,也是微软强大“产品体系”的支撑:搜索Bing、办公全家桶、个人助理、以及广告营销等等面向企业的云服务。

这就像创投圈里有一条“金科玉律”:如果创始人是技术达人、极客,那给钱的同时,一定要再给一位懂市场的合伙人。从而避免技术叫好,但收入不叫座。

因此,重视技术的同时,也更关注应用引导、产品驱动。尤其对于大模型企业而言,与其告诉合作伙伴,我强大的AI能力有很多,你想怎么用都行;也许,提供一些产品模块,更贴近现实。那么,好产品,如何做呢?


02 从通用到产业


哪怕诸葛亮上知天文下知地理、哪怕达芬奇又会画画还会解剖造飞机,但他们也只能局限于那个时代的知识。而人工智能则可以依靠大量的输入,极大地扩充知识边界。

但是,人工智能的智慧,也并不是完美的通用。从这几个月的体验来看,AI时不时地会“一本正经的胡说八道”。也许AI不是在故意撒谎,但肯定说明通用大模型依然不完善。

尤其当涉及到一些具体领域,比如金融、教育等等,通用大模型的局限性就会显著。毕竟,总有许多领域,姜还是老的辣,know-how很关键。

但,如果大模型无法进入产业,那价值量就会大打折扣。尤其对于我们具备庞大丰富产业链基础的国内而言,各个垂直产业都应和新技术结合来降本提效、产生新价值。

那么,在垂直领域,只需要做小模型就可以了呢?答案是否定的。行业小模型可以解决具体领域的问题,也可以做得还不错,但会存在两个问题。

一是泛化性不足,一旦更换了场景可能就要重新做一遍,这样就会导致成本大幅上升。一人一道菜、道道不重样,这样开饭店肯定倒闭。所以,有限的智能,并不智能。

另一方面,在应用过程中,如果用户突然提出一些跨领域的问题,小模型也会迷茫。显然,产业交叉的趋势越来越明显,就像电动车,既是车也是电池还是半导体。一旦站在用户的视角思考,即使是完全不相干的领域,也更希望得到一站式的服务。

所以,大模型需要走进垂直产业,垂直产业也需要大模型。该怎么做?一个观察样本是京东。

2021年,京东就率先将领域知识注入大模型,从而可以将模型准确率从83%提高到96%。就在昨天,京东面向产业推出了千亿级的言犀大模型。根据介绍,它的训练数据中,70%是通用大数据,另外30%则是京东各个板块经营过程中真实积累的行业know-how数据,包括零售、物流、健康、金融等行业

果然是成年人不做选择,而是既要还要。

实际上,这也是正确的做法。这一轮生成式AI很有吸引力,也是因为算法很强、数据很丰富、算力也够强。而且大模型不是静态的,是不断学习的。因此,数据和算法就形成了“飞轮效应”,好数据越来越多、算法也会越来越先进;算法越有效果,使用者增加,数据反馈也会更多

因而,尽早形成“数据-算法”的闭环,既是产品成功的路径,也是企业竞争的关键。

另外,优质数据,也是稀缺的。在名为《Will we run out of data?》的报告中显示,质量好的自然语言数据,最快可能在2026年就会被大语言模型耗尽。谁有好数据,谁就有更好的“弹药”。而好的数据,尤其是产业领域,必然来自于真实的产业场景。

于是,“数据-算法”的闭环,演绎为了“场景-产品”的比拼。而只有走进场景,才能实现大模型从“能力涌现”走向“价值涌现”。


03 从原生走向赋能


实现产业价值涌现,一种方式是和产业互助,科技企业提供技术,产业提供know-how。而另一种方式也是最好的方式,那就是从产业而来。

自身拥有产业业务,就会有真实的、宝贵的“高质量数据”:吃过亏、踩过雷、打过仗、打胜仗、会打仗。这些数据,就像催化剂一样,能高效驱动大模型开发,更贴近业务、更解决问题。

一个过往案例就是云服务在国内的发展。无论国内还是海外,云的初始都是从企业自身的需求开始,随后面向市场。在云服务之初,每一家的“产品”似乎也都一样,你有的我也有。然而,随着技术和业务结合的不同,每家也开始各有特色。

以京东为例。京东从“营销、交易、仓储、配送、售后”等业务为起点,但伴随着实体供应链网络一步步完善、内部供应链数字化的层层推进,以及京东自身在零售、金融、物流、健康、工业等领域的深扎根发展,京东也逐渐完成了从由“甘蔗的后五节”向“前五节”的拓展:有平台、有场景、有AI、有经验

随后,京东将供应链的经验,依托京东云的技术,提炼为“数智供应链”产品和服务,向社会输出。从而形成了数字基础设施提效、产业协同提效、城市智能化管理等能力。

如今,京东数智供应链上有超千万的自营商品SKU,服务超800万家活跃企业客户,其中90%以上是在华世界500强企业和全国近70%的专精特新中小企业,也和全国超过2000个产业带达成深度合作。

这种长链路、复杂协同、更多动态数据回流的京东场景,就是大模型的最好练兵场,也是产业优势的最好体现。

从内部云到外部云的经验,也正被应用到大模型的发展上。京东也提出了大模型的“三步走”:

图片来源:京东云

首先,今年7月,言犀大模型上线,具备基础层、模型层、MaaS、SaaS四层体系。其次,在内部各业务领域“磨炼”半年,也适度和外部合作伙伴进行标杆性合作,经历“出错、改良、总结”等多次循环,实现产品融合。最后,在2024年上半年,对产业输出,以更优的姿态、更开放的生态,服务产业,提效产业。

内部应用,也已经颇有效果。比如在金融营销领域,这也是京东的“老根据地”。京东金融数十年的业务发展,积累了丰富的知识,和AI结合,可以在关键性任务、动态适应性、用户体验等方面高效优化。

比如,降低运营人员的学习成本与操作成本,实现方案生产效率上百倍提高;将过去涉及产品/研发/算法/设计/分析师等5类以上职能才能完成的流程,压缩至1人;同时,一个入口的全新交互模式,让人机交互次数从2000次降低至少于50次,将操作效率提升了超过40倍。

数字大幅度的提升,也说明,虽然从节奏上看,这个三步走,似乎是有点慢的。但考虑到大模型的投入成本、对产业的重大影响,采用步步为营,也才能转变为“步步为盈”,让技术产生效益。

或者说,其实也并不慢,因为真正实现产业突破,本身就是不容易的事情。但正如京东集团CEO许冉的信心,从产业端切入大模型,如同从北坡攀爬技术珠峰,道路虽然更加艰难,却有更波澜壮阔的风景,有巨大的探索价值。把实体和数字化的供应链做透,才能把大模型赋能实业做实。

正如Gartner曲线所总结的经验,事物的发展都会经历“技术萌芽-期望膨胀-破裂谷底-爬升复苏-生产成熟”等阶段。而用另一句话来总结就是:不要把节奏问题当结构问题。

技术的发展是必然趋势,人工智能在“数据、算法、算力”三要素的推动下,也必然会不断发展;只是,这期间必然会有一些波折。需要的是,企业在技术研发、应用上的科学节奏,以及看到趋势、愿意坚守的长期主义。

京东在供应链上的坚持和突破,就是长期主义胜利的一个缩影。而今,在大模型竞赛中,在人工智能浪潮中,需要的也是如此。

可以坚信的是,技术落地虽有节奏,但只要扎根产业,就必然会诞生巨大的价值。正如京东集团CEO许冉所言,当产业效率和产业的边界拓展,得到质的提升后,大模型才有了更重要的实际价值和意义,将不亚于又一次工业革命。

而人工智能的公式也演绎为了“场景、产品、算力群、产业厚度”,这就是推动大模型从“能力涌现”到“价值涌现”的关键。

[1] 经纬张颖:AI的远与近,混沌学园,2023;

[2]《莱特希尔报告》(LighthillReport),ScienceResearch Council of Great Britain,1973