不谈梦想的国产大模型,开始认真赚钱了

转载
432 天前
4103
Model进化论

文章转载来源:Model进化论

原文来源:硅基研究室

作者:山核桃 白嘉嘉

图片来源:由无界 AI‌ 生成

有着百年历史的《时代周刊》在近期评选出了一份关于「全球百大AI人物」的榜单。李彦宏、Sam Altman、黄仁勋、图灵三巨头、中国科学院曾毅、李飞飞......这份可能集结了所有AI大牛的榜单里,再一次向人们宣告着AI对现实世界的巨大改变。

但在榜单之外,狂飙大半年的国产AI大模型确实在影响每一个普通人的生活。首批大模型通过备案,全面开放后,「文心一言」们已成了时下最流行的应用之一。百度的员工们在直播间里手把手教起了用户如何写Prompt,科大讯飞也拿出真金白银激励用户参加讯飞星火的活动。

过去一段时间内,从通用大模型的参数与能力迭代,到垂直领域的应用案例,国产大模型经历了早期的成长后,已进入一个新的阶段——机遇是来自更大的流量与更普及的行业认知,但挑战则在于产业落地的艰难与商业模式的模糊。

尽管受益多重利好,但国产大模型依旧还有许多硬仗要打。


01 大厂路径分野,创业者以小搏大


9月7日,随着腾讯正式发布其通用大模型「混元」,中国大模型赛场上终于等来了最后一位重量级的大厂选手,至此阿里、腾讯、百度、京东、字节等互联网科技企业已全部集齐完毕。

大模型狂飙大半年来,在卷参数的规模战之外,大厂们在大模型领域的布局也已形成了明显的分野。

一是态度的分野。百度、阿里是典型的激进派,其对大模型的布局不仅体现在对内的业务赋能上,也体现在对外的大模型能力输出上。

百度尤为强调AI对原有业务的重构,百度创始人李彦宏曾多次强调「AI原生」理念。

所谓的「AI原生」实则是回到问题的起点,一切用AI的视角、AI的框架、AI的方式来解决问题,让人工智能无处不在。不难看出,AI原生符合第一性原理,对于在AI领域投入多年的百度而言,是一个颇有想象力的故事。

但百度是否能讲好「AI原生」的故事?这背后也存在诸多不确定的因素。

比如,有观点认为,目前国内所强调的「AI原生概念可能是一个伪命题」。「原生」强调新技术所带来的交互方式与产品体验所带来的颠覆式创新,参考移动互联网时代,由iPhone所引领的技术创新彻底改写了PC时代的竞争格局。从这一点来说,国产大模型此轮竞争中是否能利用技术带来彻底的产品交互革命,这或许将成为竞争的关键。

但现阶段,随着监管放开备案,包括百度等大模型厂商全面开放其产品,C端用户的争夺下,产品体验是优是劣,大厂口中所谓的交互方式是否能真正为用户提供有效的解决方案,这些问题也都将从幕后的「榜单测评」走向台前的「真枪实战」。

而阿里则率先高调地走起了开源路线,同时也将AI写在了战略层。

逍遥子闪电退休后,阿里新任CEO吴泳铭在最新全员信中提到阿里的两大战略重心:用户为先和AI驱动,阿里将围绕技术驱动的互联网平台业务、AI驱动的科技业务和全球化的商业网络三类业务加大战略性投入。

在开源生态上,此前,阿里云宣布其通义千问系列大模型均开源允许免费商用,成为国内首家开源的科技大厂。近期,阿里云推出的大规模视觉语言模型Qwen-VL也一上线就宣布直接开源。

而反观京东、腾讯、字节等大厂,则在这一波的竞逐中,选择了较为保守的态度。这些大厂反复强调产业、业务等关键词,干自己最擅长的事。例如腾讯强调「连接器」,专注自研产品,让伙伴唱主角。火山引擎(字节云)在8月低调公测其基于云雀大模型开发的AI对话产品「豆包」后,随后将大模型能力引入落地其擅长的视频、营销等领域。

速度的快与慢,态度的激进或保守,背后是大厂对自身角色定位的差异,也是大厂们的战略分野。

百度的激进体现在对内的开放,用AI原生武装自身,对原有业务重构,原因在于百度对自身AI企业的定位,因此对外以「集成者」的身份。而阿里的激进则体现在对外的开放,无论是开源路线,还是内部孵化出「妙鸭相机」等爆款应用,在阿里「1+6+N」变革下,格外强调「孵化-独立」的模式。

但在大模型竞争的早期,无论大厂们路径如何分野,短期内目的地殊途同归——都是为了做大生态。

而在大厂之外的大模型创业者,则是以小搏大,在寻找自身的护城河过程中,面临更多的不确定性。

在上一轮的创业者浪潮中,我们看到创业者普遍的焦虑有:现在做通用大模型还有机会吗?如何避免沦为「套壳公司」的危机?究竟是拿着锤子找钉子,还是找到钉子再造锤子?

大半年过去,这种焦虑并没有结束,创业者们依旧恐慌,但也有一些明确的方向。

首先,大模型目前来看是巨头的游戏,但创业者可以「以小博大」。在中间层与应用层上,依旧有广阔的创业空间,虽然这依赖成熟的算力基建和清晰的商业模式。

其次,规模不再是绝对的追求,做大模型重要,但「如何用好大模型」更重要。因此将「大模型做小」也是落地行业的关键。国内某头部券商传媒行业分析师曾在一次行业分享中,向「硅基研究室」提到:“中国最擅长场景与应用,大模型外,在中模型和小模型上也会非常厉害。”

此前,360创始人周鸿祎也提到类似的观点:“关于大模型,中国还有另一条路,就是把大模型做小。”但「做小」对意味着做精做专,这对行业玩家的专业知识、数据集质量以及应用端部署的方式等都提出了更高的要求。


02 落地产业,国产大模型还要闯多道关


行业玩家的变化外,从落地进展来看,当下的大模型行业,炫技的人少了,谈产业落地的人多了。

比如,京东集团CEO许冉曾将大模型的价值总结为「算法×算力×数据×产业厚度的平方」,腾讯在大模型的产业路线上,也表现出了专注与聚焦。在前不久的2023腾讯全球数字生态大会现场,腾讯集团副总裁、政企业务总裁李强则强调:“腾讯坚定推动大模型走入产业全链条,从田间到产线,从实验室到便利店,大模型将无处不在”。

大模型落地产业,是各方关注的重点,但理想很远大,但现实很骨感。

产业场景中最难啃的,也最能验证大模型所许诺的生产力变革的,工业制造业就是一个直观的案例。

大模型在工业场景中的终极应用,是成为一颗统筹全局的工业大脑。消费者在手机上根据个人喜好生成产品并下单至工厂,订单被大模型读取后排入生产计划当中,点对点地监督每一个环节,最后将产品托付给物流体系,直到真正送达消费者手中。

在这个过程中,由大模型统领的柔性供应链解决了企业的库存压力,消费者可以上网实时查看自己下单的产品在哪一个车间里,工厂管理人员不必一遍又一遍地巡逻,只需要在系统发出预警后安排相应技术工人检修。

客观来说,大模型想落地工业场景,第一道难关——数据,都还没过。

众所周知,数据、算力、算法是决定大模型质量的三大要素,数据质量的高低直接决定了模型能力的上限。

而工业领域中,虽然数据总量大,但由于缺乏高效数据挖掘工具、缺少标准化接口、工业协议七国八制等问题,工业数据普遍分散且质量低,真正能用于模型训练的部分并不多。而这也是今天工业大模型难产的主要原因。

即便过了数据关,大模型技术研究的局限性,也让企业也很难接受在生产线中布置这样一个不稳定因素。

「涌现」能力是本轮大模型热的技术原点,ChatGPT之所以能引爆AI领域,正是因为OpenAI将参数增加至千亿级别后,大模型出现了一些意想不到的能力。

但问题是,不论是学界还是产业界,对「涌现」的理解和研究尚处于初级阶段。也就是说,我们既不知道它是如何发生的,也不知道如何让这种能力沿着我们想要的方向发展。

这种「黑箱」属性意味着,一旦模型出现问题,或是企业生产策略发生改变,就需要对模型重新进行调整,通过调整数据配比、数据输入顺序、算法等去「碰运气」,而不是像修车一样可以点对点地修正错误。

对企业来说,这种充满不确定的成本波动,甚至可能导致整条产线长期陷入瘫痪。因此从短期来看,大模型距离真正嵌入生产线各个环节还遥遥无期。

但不可否认的是,务实的中国工业人,仍找到了一些大模型的用武之地。

「硅基研究室」在一些工业制造企业的实践经验了解到,比如,任何一家企业都不希望看到因为设备故障或安全事故导致工厂停工,但想要杜绝这一点并不容易。因为在实际生产中,那些细微的变化所导致的风险并不容易被肉眼观察到,只有通过综合多个器械的运作数据,实验室里的深度分析,并辅以「老师傅」浸淫行业几十年得来的经验才能发现端倪。

老师傅们做不到的,大模型则可以信手拈来。远超肉眼和人耳的观察、分辨能力,使得大模型能透过机械坚硬的外壳观察到内部齿轮的微小变化,经由与企业知识库中的各种案例结合,直接生成风险报告供安全人员参考,因此可以有效降低生产风险和用工门槛。


03 加速商业化,从谈梦想到开始认真赚钱


更直观的改变是,国产大模型厂商都已加速了商业化的布局,从谈梦想开始认真思考如何赚钱。

这背后一方面是来自政策与监管层。随着大模型应用通过备案,企业们的产品直接面向公众,未来一段时间内,大模型厂商会在产品扩散上加码投入,抢用户心智。

「硅基研究室」观察到,百度自「文心一言」全面开放后,已在其官方账号开设多场直播,百度的员工们在直播间教用户如何使用产品,学写Prompt。科大讯飞更是拿出真金白银设立「讯飞星火助手应用挑战赛」,号召用户分享创建的星火助手,参与就有机会瓜分10万奖金。

图片来源:科大讯飞微信公众号截图

产品心智战打响,商业化被提至优先级,倒逼企业必须思考其商业模式。上述传媒行业分析师提到:“商业化是大模型的第一要素,所有的商业设计都要把商业化放在第一位,这是共识。”

目前来看,国内外大模型行业的变现模式主要分为四种:一是通过大模型对话应用,根据提供增值服务订阅制付费,例如OpenAI的ChatGPT Plus服务等。二是出售大模型API接口,按调用次数收费。三是售卖大模型开发服务,靠大模型行业解决方案挣钱。四是,将大模型能力融入当前业务产品,靠大模型优化产品能力以获得更多商业回报,帮助存量客户降本增效。

但目前来看,国产大模型在四种变现模式上,实际都各有各自的难处。

首先,通过大模型对话应用付费,但C端用户的付费意愿还有待培养。其次,靠出售大模型API接口赚钱,则面临竞争激烈,利润微薄的困境。小冰CEO李笛曾在一次采访中提到:“我们应该提供API,收取每次调用的钱。这个收入是很少的。”

原因在于,一方面是竞争环境的变化。OpenAI推出ChatGPT企业板、Meta开源 Llama2,在产品推广中,行业或迎来「价格战」;另一方面,API接口开放带动算力需求,最终的收入流入了算力基建,又是一场卷算力的竞争。

而在售卖大模型行业解决方案上,如上文所提到的产业竞争格局,目前来看还处于「抢订单、立生态」的过程,距离真正的商业化还有距离。而在第四种模式可能是最容易落地的场景,本质是利用大模型对旧场景的改造。

例如钉钉做AI PaaS,阿里妈妈(阿里旗下的数字营销平台)就针对电商场景发布了两款融入AI能力的一站投放系统,都是可落地的场景,但能否在存量里淘到更多金子,则需要打上一个问号。

而在大洋彼岸外的OpenAI,此前根据《The Information》的报道,预计在未来 12个月内,通过销售人工智能软件及其计算能力,OpenAI将获得超过10亿美元的收入。而梳理OpenAI的商业化历程,其已经走过了从过去低价低频的API模式转型高定价、高粘性的2B付费模式等更多样化的收费方式。

而OpenAI从吞金兽到能赚钱的前提是,其已形成了一定的用户规模,能够形成自身的数据飞轮,不断迭代产品体验。而对比国产大模型,依旧还处于早期。

毫无疑问,对国产大模型而言,一场更难的硬仗已经到来了。

参考资料:

1、晚点LatePost:《首批大模型通过备案,更激进的投入开始了》

2、极客公园:《沸腾251天,访谈近百位从业者,关于大模型世界的5个现状》