中国大模型这一年:钱、场景与未来

转载
336 天前
5160
Model进化论

文章转载来源:Model进化论

原文来源:硅基研究室

作者丨山核桃

图片来源:由无界 AI生成

临近年末,不少科技公司与媒体都开始筹备年底总结。恰逢chatGPT诞生一年,「硅基研究室」和不少业内人士在交流中也发现,比起去年想要迫切追赶的焦虑,今年大家的态度似乎都慢慢回归于冷静。

总结来看,谈概念的人少了,谈落地的人多了;说理想的少了,想如何赚钱的人多了;标榜自己是「中国的OpenAI」的人少了,讲商业模式和付费能力的人多了。

据自媒体「光锥智能」的统计,2023年八个月内就诞生了238个大模型,基本每隔一天中国就会官宣一个新的大模型,这样的「中国速度」令隔壁的硅谷都汗颜。

但回到现实,我们更应关注的是一年多来,在AI世界里,中国的投资人和中国的大模型厂商究竟干了些什么?又将带来怎样的改变?


01 钱的流向:风大鱼贵,大厂创企都有机会


看中国AI发展到哪一步了,先看「聪明的钱」的流向。

回顾过去一整年,尽管投融资行业整体收敛遇冷,但AI依旧是热门赛道。根据根据 IT 桔子的数据,截止到2023年11月20日,今年中国人工智能赛道在一级市场的总融资事件数依旧达到了530起,总融资交易额估算有631亿元。

而在这之中,也诞生出一批备受瞩目的AI独角兽企业,最火的就要数百川智能、智谱 AI、零一万物、Minimax 名之梦这4家企业,而他们背后站着的不仅是诸多明星机构,还有大厂们间的联盟。

从投资逻辑来看,投早、投贵成为了典型的趋势。不少投资人也向「硅基研究室」提到:“好的项目还是太少了。”

在腾讯科技Hi Tech Day暨2023数字开物大会上,英诺天使基金合伙人王晟也观察到了类似的趋势:“今年AI投资显著的特点,导致大家投的项目都是高度集中的,都是最贵的,所以很显然都是要投得更早一点,稍微差一点就会变得非常贵。”

背后的原因也并不难理解,一是算力的掣肘下,并非所有玩家都又能力大力出奇迹。二是随着技术周期的变化,AI竞争也逐步迈入强调商业化与商业场景的阶段。

根据Gartner提出的「技术成熟度曲线」理论,目前生成式AI处于「泡沫巅峰期」,需要更多商业场景落地才能实现技术的规模化应用。

昆仲资本投资副总裁陈希就观察到,AI大模型在今年上半年和下半年还有比较大的变化。“上半年特别热,下半年相对来讲投资人会变得稍微冷静一些。”他也表示,市面上很多项目估值存在比较高的溢价,目前投资人还是期待很多新的商业机会和商业前景出现。

另一个关键问题也随之而来,投早投精投贵也就意味着AI大模型创业面临更激烈的挑战。这之中,创业者始终会被拷问一个问题:如何与大厂竞争?

从部分投资人与企业的观点,我们也发现了当下的两点共识:

首先,大厂的优势是相对的,但不是绝对的。“因为算力问题,大厂的优势可能是被放大了,这是我们认知的事实,长期而言,我们看到的是由于大厂的算力和先发优势。”在腾讯科技Hi Tech Day暨2023数字开物大会上,昆仑万维董事长兼CEO方汉这样谈到。

其次,创业公司更应做的是「破坏式创新」。大厂在过往竞争中所形成的路径依赖并不能实现一家通吃,大厂往往需要追求业务的稳定性与长期性,从这一点来说,做高度不确定的事——这种机会属于创业公司。

“所有的创造性破坏都是小厂搞出来的,今天的大厂都是过去的小厂,破坏了过去旧的产业结构就会成为大厂。”王晟这样说。


02 场景涌现:循序渐进,找准PMF


前不久,斯坦福华人博士的AI视频创业项目Pika 火遍全网,一时间也引发了科技圈的反思:为什么我们总是做不出来杀手级应用?

事实上,在讨论AI大模型时,我们总会提到两个方向:一是B端,另一个是C端。但事实上,B端和C端的界限其实非常模糊,比如ChatGPT的ChatBot交互,MidJourney、Stable Diffusion,本质上都是先让C端用户玩起来,然后在B端产生价值。

从移动互联网到大模型时代,过往一年中,人们都在期待「杀手级应用」的诞生,但其实产品寥寥,背后的关键原因,一是我们错误地理解了「杀手级应用」的含义,二是很多企业根本找不准PMF。(Product / Market Fit,产品市场匹配)

所谓的「杀手级应用」,看似是短暂的爆红,但更应被定义为是否形成高频使用,形成用户粘性。如何形成高频使用?还需回到第一性原理——回归产品,找准PMF。

木牛机器人的创始人郭林认为,更应该从「产品视角」出发,更应该用新的供给方式去解决一些麻烦的问题。“在哪些真正具体的场景中,有哪些用户群体真正面临的问题,是靠过去的技术不能解决的,从用户需求出发,就能产生好的产品,把一个问题解决好就是爆款应用。

“商业不能光看技术,还要看外面的包装。”清华大学交叉信息研究院助理教授袁洋,他目前的研究方向是智能医疗领域,他也表达了类似的观点。

他打了个「卖车」的生动比喻:“卖车最关键是车的发动机,但现在卖车还卖很多别的,包括内饰和造型,这些其实是一种包装。发动机在外面加上品牌、加上装饰,最后不只是卖发动机的零件,而是整个车卖很多钱。”

回到大模型本身,必须深入场景,去更好地「包装自己」,才能具备更大的商业价值。

除了找准PMF外,大模型赋能场景,是一件循序渐进的事,是一件「急不来」的事。特别在「难啃的硬骨头」,如在工业制造业领域,如何将技术落地复杂的工业场景与具体的生产流程,都是一场硬仗。

通用大模型虽然已经很好,但面对专业领域、专业知识还是相对匮乏的,能力也是需要提升的。

在腾讯科技Hi Tech Day上,思谋科技SmartMore联合创始人刘枢提到了这一点:“通用大模型虽然已经很好,但面对专业领域、专业知识还是相对匮乏的,能力也是需要提升的。”大模型领域的「幻觉」问题一直被反复讨论,在工业制造业这种严肃精密场景,「幻觉」所带来的往往是不可估量的损失。

算力、算法、数据,是AI时代的核心三要素,不少业内人士此前也向「硅基研究室」提到,「结构化、更高质量的数据」是工业制造业场景的核心壁垒之一。中工互联科技集团也同样深耕工业大模型领域,董事长智振提到,他们整一年都在做深入的思考,如何解决大模型存在的诸多不确定性。

他提到,目前不光是中国,国外大模型理论也没有怎么搞明白,所谓的幻觉问题。“现在很多东西还是从外部工程的角度去尝试,怎样提高确定性,这是一个技术创新方面的问题。”


03 AI与人:新世界、新可能


而随着AI浪潮的涌来,带着「后视镜」去眺望AI未来,每一个身处其间的人应该关注什么?这同样是一个值得思考的未来之问。

过去一年间,无论是个体、企业抑或是国与国间的竞争,AI所带来的改变是深远的,所带来的挑战也是严峻的。

大洋彼岸外,从OpenAI「宫斗」所爆发出的保守与激进两个阵营间的路线之争就能看出,如何规避AI风险,解决相关伦理问题,某种程度上,将这些问题前置,也是在竞争中抢占话语权的体现。

比如在数据层,中国人民大学交叉科学研究院院长、教育部长江学者、特聘教授杨东就认为,过去移动互联网时代,中国存在严重的数据风险主义。大模型不能及早地产生和发展的根本原因在于数据没有互联互通。本来在移动互联网时代的先机,包括海量的数据、丰富的场景、信息的举国体制等是非常好的优势,但在进一步的数据共享、数据开放方面是落后的,导致大模型训练需要的语料、数据的基础设施比美国落后。

因此,杨东教授认为,当务之急就是要把数据资产、数据场景、数据价值的实现机制,包括价值实现以后的利益分配机制优先考虑建立。

诗人博尔赫斯曾说过:“时间永远分岔,通向无数的未来”。某种程度上也可以成为这个技术新时代的注解。人们总会短期高估技术的影响,长期低估技术的魅力,只有经历一个从神化到祛魅的完整过程,才会看到技术的新可能。

而对中国大模型而言,经历了一个完整周期的2023年,热闹过,痛苦过,也激动过,面对新的2024,我们有理由相信,中国大模型会更有自信,也更有底气。