大模型赚钱4大流派，谁能赢？

文章转载来源：AI梦工厂

原文来源：鲸选社pro

作者：杨晓鹤

图片来源：由无界 AI生成

2023年，可能所有投资人都在问被投公司，“咱们能不能整个大模型？”

没有互联网公司想错过这波大模型热潮。在11月30日，ChatGPT迎来一周年之际，据百度CEO李彦宏先生所言，国内目前已经涌现了230多个大模型。最直接的吸引力，就是OpenAI 公司估值疯涨到900多亿美金。

每家公司都在跃跃欲试，百亿还是千亿规模参数，自研还是套壳技术，也许都没那么重要，搞出来一个大模型开个发布会，还是非常必要的。

投资人催促，市场同行关注，客户/用户期待，这项CEO 1号工程从年初热闹到了年末，尽管李彦宏多次演讲，重复造大模型是极大的资源浪费，都没挡住国产大模型的数量，从年中到年底的数量翻了3倍。

这其中文心一言，通义千问，智谱ChatGLM等最早的大模型，还有混元/豆包等一系列重点项目，都吸引了大众关注的目光。然而在舆论关注消退，一个现实问题摆在了企业面前，如何利用大模型赚钱？

“怎么来平衡技术和商业化中间的关系，也是投资人一直问的问题”。智谱AI CEO张鹏就在近期表达，“我们一直是坚持两条腿在走，因为我们公司成立的第一天就有客户、有收益，可能和我们的投入相比，目前还不够自己覆盖掉所有的成本。”

其实何止是创业公司，就是算已经上市的大企业，面对大模型长期投入，也在思考如何活下去。「鲸选社Pro」根据市场上各大企业的大模型商业化选择，归纳了赚钱4大流派。客观说，大模型市场混沌时期，各种商业化探索都十分有益。

第一派：“自研派”vs“对标者”，生态是关键

前阿里巴巴CEO张勇曾指出，超万亿参数的大模型研发是一场“AI+云计算”的全方位竞争，囊括了算法、底层庞大算力、网络、大数据、机器学习等诸多领域，是一项复杂的系统性工程。

因此，国内仅有BAT级别的超级玩家，通过自研千亿乃至万亿参数的大模型，然后建立“AI+云计算”的生态，输出MaaS(平台即服务)。

百度在3月份推出文心千帆平台，业务内嵌在百度智能云生态。而文心一言则是文心千帆平台上的大模型之一，此前数据显示，文心千帆接入的第三方模型已经达到45家。百度的目标是更多企业来到文心生态发展，就算不调用文心大模型API，也利用百度智能云的服务，百度通过这些底层服务能力做营收。

因此百度还设立奖金，组建了文心生态杯创业大赛。BuySmart等初创企业共同赢得了千万奖金。

根据百度文心发布的公开数据显示，截至今年8月，飞桨和文心生态已有800万开发者。文心一言自8月31日面向全社会开放服务至今，用户规模已超过7000万。API是AI原生应用调用大模型的主要方式，其调用量比国内200多家大模型的调用量总和还要多。

国内另一大模型生态是阿里云魔搭社区，据其运营人员成晨介绍，成立近一年，魔搭社区已有超过2300个模型，开发者超过280万，模型下载次数也超过了1亿多次。

据了解，文心大模型标准版收费0.8分/1000 tokens，对比OpenAI 看，每1,000个token收费0.002美元，据说ChatGPT每个问题付出的成本是0.03美元，收费远不足覆盖成本。

微软小冰CEO李笛近期也介绍了类似案例，2018年，微软小冰给罗森做了一个销售助理，可以给2000万的罗森用户提供信息，“每次我们给罗森drive（调用）几千万次，但罗森只付我们10万元人民币，按照调用次数去计算价值。”

因此API的收入很难规模化，尤其相比训练等研发成本来说，API模式的收入杯水车薪。不过，API模式却能促成平台和生态企业的深度绑定，在此基础上，百度阿里都有向客户出售云服务的能力，这部分商业化更有前景。

与此同时，更多商业化路线也在对表OpenAI。国内很多公司也在基于ChatGPT的框架训练，也在学习ChatGPT的C端规模化营收能力。

这其中李开复老师的零一大模型受到争议较多，在被前阿里云首席科学家曝出“换名研发”后，很多人认为Yi-34B 大模型是套壳。零一公司内部有高管借助国外开源人士的反驳：架构是学术研究产物，数据集是自己从头训练的，这在开源领域是常见常规的事情。

字节此前被曝出违规使用OpenAI训练自己的大模型，对此字节回应在4月公司引入GPT API 调用规范检查后，这种做法已经停止。

其实，国内从零开始研发大模型的也就只有三家公司——百度、阿里、智谱。其余皆在对标，这种对标程度深浅不一。不仅是研发对标学习，其实商业化也在对标学习。

文心一言的App，也有付费会员的选项，这部分是To C的营收。目前文心4.0的价格是连续包月49.9元，相比ChatGPT4 Plus每月20美元，价格仅为后者的3分之一左右，不过目前文心的会员数量还不详，不清楚市场的付费意愿强度。

面向C端收费，这也是字节跳动在大模型领域的主要商业化模式，在云雀大模型的基础上，疯狂推出多款C端对话产品。字节在国内推出了对话产品「豆包」，海外上线 AI 产品「ChitChop」，同时豆包还有海外版本「 Cici 」。字节不同的事业部都在推出AI对话产品，其中豆包App 是抖音集团推出，所以目前在抖音上的投放很多。

无论纯自研还是对标，未来二者都会赢得市场，最关键的是谁能建立商业化生态，这才是下一阶段淘汰赛中活下来的根本。

第二派：.开源VS闭源，如何杀出重围？

移动操作系统中，最后仅剩两家系统：开源的安卓和闭源的苹果。

而在大模型的竞争市场中，也存在开源和闭源之争。相比ChatGPT 的闭源模式，一家公司建立研发到商业化的生态闭环，开源大模型参与的玩家多来越多，声量也越来越大。尤其年中 Llama 2宣布开源，更是将开源大模型推到舆论关注的前台。

但在国外开源生态中，Llama2-70B和Falcon-180B等标杆模型为“有条件”开源，客户的产品月活不能过亿等，并因缺乏训练数据在中文能力上有明显短板。

这给了国外开源大模型的发展机会，智谱AI和百川智能是这类创业公司代表，阿里云则是大公司的代表。

智谱最早打起开源免费竞赛，7 月 14 日，智谱 AI 和清华 KEG 宣布对 ChatGLM-6B 和 ChatGLM2-6B 完全开放，允许企业免费商业使用。根据智谱 AI 的官网， ChatGLM2-6B 不限实例+不限推理或微调工具包的私有化报价为一年 30 万。

王小川紧跟智谱打开源免费战争，百川智能相继公布Baichuan-7B Baichuan-13B 开源免费可商用大模型。尽管市场上传言百川基于LLM开源大模型，不过百川的数据训练做得不错，有企业评价中文环境下表现不错。

综合来看，创业大模型公司，免费开源是更明智的选择。依靠开源这些参数规模较小的大模型，创业公司敲开客户企业的大门以及市场的认知。

百川在服务一定企业的数量后，后续则推出闭源的大模型，王小川解释称：“模型变大之后没有走开源的这样一种方式，因为大家部署起来成本也会非常的高，就使用闭源模式让大家在网上调用API”。

而智谱的商业化思考则比较独辟蹊径，“我最近也跟一些投资人在聊，国外真正的AI落地过程当中最明确的一个需求、一个场景就是代码辅助，大概占整个付费意愿里面50%以上的场景。”张鹏说道，“所以我们也在做类似的落地，我们有自己的代码生成模型，目前在线上也向全球超过每天10万的用户去提供数千万行代码的生成能力。”

这相当于把大模型的某一方面能力锻炼到极致，这一方面还正好是市场刚需，这样大模型就具备了赚钱能力。“智谱AI在十分努力做商业化，可能筹备2025年登陆科创板。”一位投资人向AI鲸选社表示。

巨头中，阿里扛起了开源的大旗。12 月 1 日，阿里云通义千问 720 亿参数模型 Qwen-72B 宣布开源。至此，通义千问共开源 18 亿、70 亿、140 亿、720 亿参数的 4 款大语言模型，以及视觉理解、音频理解两款多模态大模型，号称实现了「全尺寸、全模态」开源。

根据公开数据显示，阿里QWEN-7B开源一个多月下载量破100万，9月25日升级了QWEN-14B；百川智能开源的Baichuan-7B、13B两款开源大模型下载量目前已经突破500万，200多家企业申请部署开源大模型。

从以上数据看，开源大模型还是有不错的潜力，市场还是比较认可。当然，核心的大模型产品，各家都选择了闭源，这是个普遍的行业现状。

唯一能改变这一现实的是，Meta正在加紧研发全新的开源大模型，支持免费商用，能力对标GPT-4，参数量比Llama 2还要大上数倍，计划在2024年初开始训练。

Meta之所以坚定的选择开源，一方面按其安卓的开源思路继续推进，另一方面也与其后发的大模型生态，必须依靠开源生态推进，才可能挽回落后局面有关。

大模型中，闭源的苹果，毫无疑问是Open AI，而开源的领军人物是Meta还是其他企业，还有待观察。

第三派：通用VS垂直，谁才是未来？

当下看，通用大模型门槛高，没有几十亿的资金体量很难做好自研和生态的工作。垂直大模型可以小到10亿规模参数，使用开源框架开发成本会更低，这给了初创公司机会。

所以在大模型火了半年时间后，行业就出现一个观点争论，那就是大模型是通用还是垂直才是未来。

近期，自媒体Will的统计数据显示：目前国产188个大模型中：通用27个，金融16个，工业13个，媒体12个，客服11个，医学10个，政务10个，教育9个，科研9个，大学28个，互联网21个。

这意味着，研发难度较大的通用大模型属于少数，垂直大模型则占多数。比较知名的垂直大模型，例如京东发布了言犀大模型、京医千询大模型，携程发布了携程问道大模型，网易有道发布了基于教育的子曰大模型。

而在大模型垂直化路线中，没想到最知名的企业是华为。

在世界人工智能大会上，华为轮值董事长胡厚崑阐述道：通过「5+N+X」的这三层大模型，华为云构建了自己的大模型底座。盘古 3.0 为客户提供 100 亿参数、380 亿参数、710 参数和 1000 亿参数的系列化基础大模型。

由于外界没有接触到盘古大模型，所以对其真实能力，坊间有很多议论的声音。华为没有全部笃定在通用大模型，而是选择与行业共同打造垂直行业大模型，目前已经在盘古大模型基础上，发布了7个垂直行业大模型。

有投资人表示，通用大模型可以用向量数据库训练，垂直领域表现就会出色。而垂直大模型，其实壁垒是用行业私有数据训练大模型。

比如毫末智行推出了自己的自动驾驶大模型 DriveGPT。DriveGPT学习时长达到 103 万小时，用户使用辅助驾驶里程 8700 万公里，正朝 1 亿公里数据规模迈进。平台将所有的真实道路驾驶数据，并“翻译”成统一的语言的DriveGPT雪湖·海若，利用这些数据训练自动驾驶大模型，OpenAI 肯定不会喂给ChatGPT这么多道路数据。

当然，垂直大模型很难从头做框架，这也是文心等平台的另一块重要收入，就是帮企业私有化大模型。“百亿和千亿两个版本大模型，只要客户方逻辑清晰，3个月测试，3-6个月即可落地，私有大模型部署成本在四五百万元。”有内部人士讲述百度文心大模型的市场化。

朱啸虎就提到，今年年初国内私有化部署大模型1000万人民币，年中500万，现在不到100万。私有化大模型和私有云一样，是个买卖型生意。而因此诞生的垂直大模型，则可以在医疗、交通教育等等不同业务中落地。

对于垂直大模型，此前有人认为，做通用大模型能够智能涌现，垂直大模型则难以实现。而行业声音则认为，垂直大模型利用独有数据训练，这是通用大模型再聪明也难以踏入的空白地带。

其实这种通用和垂直大模型之争，取决于ChatGPT等头部玩家的进化速度。类似Q*的出现，超级人工智能则不远。超级人工智能可能会迅速覆盖垂直大模型的能力，而如果大模型的进化速度不够快，则是私有数据决定垂直大模型的效果更好。

第四派大模型底座，支撑AIGC业务

过去的应用与产品，尽管已经开始融入AI能力，但大模型带来的AI能力，还是让人眼前一亮。从2023年开始的这波AI热潮中，借助AI升级的产品公司主要分为两类。

第一类是巨头公司，旗下拥有多个数亿用户的互联网产品。借助大模型升级，让这些“传统”的互联网产品更性感。这类公司的代表是微软、Adobe和百度等。

来源：《AI一年，人间10年》PPT

微软由于一直投资OpenAI，在大模型应用领域也是近水楼台先得月。率先将搜索应用Bing升级为大模型版的New bing，同时将大模型应用于edge浏览器和Office套件中，而且将copilot定义为未来系统级的AI 助手。

受AI绘画冲击明显的Adobe，也在3月份的Adobe MAX 大会上，发布了3 款新一代的Firefly 模型：Adobe Firefly Image2 Model 、 Adobe Firefly Vector Model和Adobe Firefly Design Model，分别涉及图像，矢量模型和设计领域。

自今年 3 月发布首个 Firefly 图像模型以来，Adobe创意社区已使用该模型生成了 30 多亿张图像，其中仅上个月就生成了 10 亿张。Adobe曾对外表示，不仅生成图像的扩散模型是自研的，甚至文本生成的语言模型也是自研的。

不同于微软垂直于对话和Adobe垂直于图像领域，百度将其旗下几乎所有业务都在通过AI重构，百度搜索、百度文库、百度地图、百度网盘等。尽管产品不同，本质上都是智能搜索，这是百度的起家领域。

综合三家看，微软受益大模型最明显，在ChatGPT发布一周年之际，微软过去一年市值增加了约8000亿美元。而努力追赶AI浪潮的Adobe，过去一年，市值增加了约1700亿美元。而百度市值则略降100亿美元左右。

第二类是创业公司，他们本身拥有行业优势的AIGC业务，后续也推出了大模型业务，让原本的AIGC业务更智能。

诸如数字人独角兽公司硅基智能，在5月份发布了炎帝大模型，硅基智能将私有域知识用 LLM 大模型技术训练，叠加硅基 AIGC 数字人技术。

近期，硅基还完成了首个AI化大V-知名科普作家严伯钧。不同于常见的2D形象复制克隆人，本次将他以往发布的1400多条科普视频、100多万字的语料投喂给AI模型进行训练，实现严伯钧的肉体（形象、声音、动作）+灵魂（知识、表达）的全部AI化，相当于形成了数字生命，并且这个生命还可以AI进化，这背后就是大模型的力量。

目前可以看到，AI严伯钧每天可以高效地向全网1200万粉丝传播科普内容，而硅基的AIGC 数字人也已经通过了图灵测试，在不同领域做短视频和直播。

美图的修图、设计等老本行，和AGI也十分相关。所以美图在年中时候，发布了AI视觉大模型MiracleVision4.0版本，计划2024年1月时期，将MiracleVision4.0版本将陆续应用于美图旗下产品：美图秀秀，美颜相机，Wink，美图设计室，WHEE等App中。

美图的视觉大模型，几乎每两三个月更新一代视觉大模型。通过体验，实现了照片变漫画、基础海报AI设计等能力。但从Google的多模态大模型Gemini，被爆出宣传效果实际经过了剪辑造假，包括ChatGPT 4也在艰难地从语言大模型向多模态大模型能力进发，可以看出视觉等大模型进化并不容易。

大模型并不是AIGC企业营收的关键，但却是发展的必需品。正如国外的Jasper估值骤降为例，没有大模型的AIGC将没有壁垒，这在行业已经形成了共识。

大模型商业化的征途上，各流派都在各显身手。360公司曾经公布，其公司大模型半年曾创造2000万左右的营收。相比大模型的研发投入，其实这部分收入还比较小。各派的竞争，也没有显现出孰优孰劣。

当然，商业化模式也不是最终壁垒，因为模式会很快被复制，只有能力是Copy不了的核心。