文章转载来源:AI梦工厂
原文来源:鲸选社pro
作者:杨晓鹤
图片来源:由无界 AI生成
2023年,可能所有投资人都在问被投公司,“咱们能不能整个大模型?”
没有互联网公司想错过这波大模型热潮。在11月30日,ChatGPT迎来一周年之际,据百度CEO李彦宏先生所言,国内目前已经涌现了230多个大模型。最直接的吸引力,就是OpenAI 公司估值疯涨到900多亿美金。
每家公司都在跃跃欲试,百亿还是千亿规模参数,自研还是套壳技术,也许都没那么重要,搞出来一个大模型开个发布会,还是非常必要的。
投资人催促,市场同行关注,客户/用户期待,这项CEO 1号工程从年初热闹到了年末,尽管李彦宏多次演讲,重复造大模型是极大的资源浪费,都没挡住国产大模型的数量,从年中到年底的数量翻了3倍。
这其中文心一言,通义千问,智谱ChatGLM等最早的大模型,还有混元/豆包等一系列重点项目,都吸引了大众关注的目光。然而在舆论关注消退,一个现实问题摆在了企业面前,如何利用大模型赚钱?
“怎么来平衡技术和商业化中间的关系,也是投资人一直问的问题”。智谱AI CEO张鹏就在近期表达,“我们一直是坚持两条腿在走,因为我们公司成立的第一天就有客户、有收益,可能和我们的投入相比,目前还不够自己覆盖掉所有的成本。”
其实何止是创业公司,就是算已经上市的大企业,面对大模型长期投入,也在思考如何活下去。「鲸选社Pro」根据市场上各大企业的大模型商业化选择,归纳了赚钱4大流派。客观说,大模型市场混沌时期,各种商业化探索都十分有益。
前阿里巴巴CEO张勇曾指出,超万亿参数的大模型研发是一场“AI+云计算”的全方位竞争,囊括了算法、底层庞大算力、网络、大数据、机器学习等诸多领域,是一项复杂的系统性工程。
因此,国内仅有BAT级别的超级玩家,通过自研千亿乃至万亿参数的大模型,然后建立“AI+云计算”的生态,输出MaaS(平台即服务)。
百度在3月份推出文心千帆平台,业务内嵌在百度智能云生态。而文心一言则是文心千帆平台上的大模型之一,此前数据显示,文心千帆接入的第三方模型已经达到45家。百度的目标是更多企业来到文心生态发展,就算不调用文心大模型API,也利用百度智能云的服务,百度通过这些底层服务能力做营收。
因此百度还设立奖金,组建了文心生态杯创业大赛。BuySmart等初创企业共同赢得了千万奖金。
根据百度文心发布的公开数据显示,截至今年8月,飞桨和文心生态已有800万开发者。文心一言自8月31日面向全社会开放服务至今,用户规模已超过7000万。API是AI原生应用调用大模型的主要方式,其调用量比国内200多家大模型的调用量总和还要多。
国内另一大模型生态是阿里云魔搭社区,据其运营人员成晨介绍,成立近一年,魔搭社区已有超过2300个模型,开发者超过280万,模型下载次数也超过了1亿多次。
据了解,文心大模型标准版收费0.8分/1000 tokens,对比OpenAI 看,每1,000个token收费0.002美元,据说ChatGPT每个问题付出的成本是0.03美元,收费远不足覆盖成本。
微软小冰CEO李笛近期也介绍了类似案例,2018年,微软小冰给罗森做了一个销售助理,可以给2000万的罗森用户提供信息,“每次我们给罗森drive(调用)几千万次,但罗森只付我们10万元人民币,按照调用次数去计算价值。”
因此API的收入很难规模化,尤其相比训练等研发成本来说,API模式的收入杯水车薪。不过,API模式却能促成平台和生态企业的深度绑定,在此基础上,百度阿里都有向客户出售云服务的能力,这部分商业化更有前景。
与此同时,更多商业化路线也在对表OpenAI。国内很多公司也在基于ChatGPT的框架训练,也在学习ChatGPT的C端规模化营收能力。
这其中李开复老师的零一大模型受到争议较多,在被前阿里云首席科学家曝出“换名研发”后,很多人认为Yi-34B 大模型是套壳。零一公司内部有高管借助国外开源人士的反驳:架构是学术研究产物,数据集是自己从头训练的,这在开源领域是常见常规的事情。
字节此前被曝出违规使用OpenAI训练自己的大模型,对此字节回应在4月公司引入GPT API 调用规范检查后,这种做法已经停止。
其实,国内从零开始研发大模型的也就只有三家公司——百度、阿里、智谱。其余皆在对标,这种对标程度深浅不一。不仅是研发对标学习,其实商业化也在对标学习。
文心一言的App,也有付费会员的选项,这部分是To C的营收。目前文心4.0的价格是连续包月49.9元,相比ChatGPT4 Plus每月20美元,价格仅为后者的3分之一左右,不过目前文心的会员数量还不详,不清楚市场的付费意愿强度。
面向C端收费,这也是字节跳动在大模型领域的主要商业化模式,在云雀大模型的基础上,疯狂推出多款C端对话产品。字节在国内推出了对话产品「豆包」,海外上线 AI 产品「ChitChop」,同时豆包还有海外版本「 Cici 」。字节不同的事业部都在推出AI对话产品,其中豆包App 是抖音集团推出,所以目前在抖音上的投放很多。
无论纯自研还是对标,未来二者都会赢得市场,最关键的是谁能建立商业化生态,这才是下一阶段淘汰赛中活下来的根本。
移动操作系统中,最后仅剩两家系统:开源的安卓和闭源的苹果。
而在大模型的竞争市场中,也存在开源和闭源之争。相比ChatGPT 的闭源模式,一家公司建立研发到商业化的生态闭环,开源大模型参与的玩家多来越多,声量也越来越大。尤其年中 Llama 2宣布开源,更是将开源大模型推到舆论关注的前台。
但在国外开源生态中,Llama2-70B和Falcon-180B等标杆模型为“有条件”开源,客户的产品月活不能过亿等,并因缺乏训练数据在中文能力上有明显短板。
这给了国外开源大模型的发展机会,智谱AI和百川智能是这类创业公司代表,阿里云则是大公司的代表。
智谱最早打起开源免费竞赛,7 月 14 日,智谱 AI 和清华 KEG 宣布对 ChatGLM-6B 和 ChatGLM2-6B 完全开放,允许企业免费商业使用。根据智谱 AI 的官网, ChatGLM2-6B 不限实例+不限推理或微调工具包的私有化报价为一年 30 万。
王小川紧跟智谱打开源免费战争,百川智能相继公布Baichuan-7B Baichuan-13B 开源免费可商用大模型。尽管市场上传言百川基于LLM开源大模型,不过百川的数据训练做得不错,有企业评价中文环境下表现不错。
综合来看,创业大模型公司,免费开源是更明智的选择。依靠开源这些参数规模较小的大模型,创业公司敲开客户企业的大门以及市场的认知。
百川在服务一定企业的数量后,后续则推出闭源的大模型,王小川解释称:“模型变大之后没有走开源的这样一种方式,因为大家部署起来成本也会非常的高,就使用闭源模式让大家在网上调用API”。
而智谱的商业化思考则比较独辟蹊径,“我最近也跟一些投资人在聊,国外真正的AI落地过程当中最明确的一个需求、一个场景就是代码辅助,大概占整个付费意愿里面50%以上的场景。”张鹏说道,“所以我们也在做类似的落地,我们有自己的代码生成模型,目前在线上也向全球超过每天10万的用户去提供数千万行代码的生成能力。”
这相当于把大模型的某一方面能力锻炼到极致,这一方面还正好是市场刚需,这样大模型就具备了赚钱能力。“智谱AI在十分努力做商业化,可能筹备2025年登陆科创板。”一位投资人向AI鲸选社表示。
巨头中,阿里扛起了开源的大旗。12 月 1 日,阿里云通义千问 720 亿参数模型 Qwen-72B 宣布开源。至此,通义千问共开源 18 亿、70 亿、140 亿、720 亿参数的 4 款大语言模型,以及视觉理解、音频理解两款多模态大模型,号称实现了「全尺寸、全模态」开源。
根据公开数据显示,阿里QWEN-7B开源一个多月下载量破100万,9月25日升级了QWEN-14B;百川智能开源的Baichuan-7B、13B两款开源大模型下载量目前已经突破500万,200多家企业申请部署开源大模型。
从以上数据看,开源大模型还是有不错的潜力,市场还是比较认可。当然,核心的大模型产品,各家都选择了闭源,这是个普遍的行业现状。
唯一能改变这一现实的是,Meta正在加紧研发全新的开源大模型,支持免费商用,能力对标GPT-4,参数量比Llama 2还要大上数倍,计划在2024年初开始训练。
Meta之所以坚定的选择开源,一方面按其安卓的开源思路继续推进,另一方面也与其后发的大模型生态,必须依靠开源生态推进,才可能挽回落后局面有关。
大模型中,闭源的苹果,毫无疑问是Open AI,而开源的领军人物是Meta还是其他企业,还有待观察。
当下看,通用大模型门槛高,没有几十亿的资金体量很难做好自研和生态的工作。垂直大模型可以小到10亿规模参数,使用开源框架开发成本会更低,这给了初创公司机会。
所以在大模型火了半年时间后,行业就出现一个观点争论,那就是大模型是通用还是垂直才是未来。
近期,自媒体Will的统计数据显示:目前国产188个大模型中:通用27个,金融16个,工业13个,媒体12个,客服11个,医学10个,政务10个,教育9个,科研9个,大学28个,互联网21个。
这意味着,研发难度较大的通用大模型属于少数,垂直大模型则占多数。比较知名的垂直大模型,例如京东发布了言犀大模型、京医千询大模型,携程发布了携程问道大模型,网易有道发布了基于教育的子曰大模型。
而在大模型垂直化路线中,没想到最知名的企业是华为。
在世界人工智能大会上,华为轮值董事长胡厚崑阐述道:通过「5+N+X」的这三层大模型,华为云构建了自己的大模型底座。盘古 3.0 为客户提供 100 亿参数、380 亿参数、710 参数和 1000 亿参数的系列化基础大模型。
由于外界没有接触到盘古大模型,所以对其真实能力,坊间有很多议论的声音。华为没有全部笃定在通用大模型,而是选择与行业共同打造垂直行业大模型,目前已经在盘古大模型基础上,发布了7个垂直行业大模型。
有投资人表示,通用大模型可以用向量数据库训练,垂直领域表现就会出色。而垂直大模型,其实壁垒是用行业私有数据训练大模型。
比如毫末智行推出了自己的自动驾驶大模型 DriveGPT。DriveGPT学习时长达到 103 万小时,用户使用辅助驾驶里程 8700 万公里,正朝 1 亿公里数据规模迈进。平台将所有的真实道路驾驶数据,并“翻译”成统一的语言的DriveGPT雪湖·海若,利用这些数据训练自动驾驶大模型,OpenAI 肯定不会喂给ChatGPT这么多道路数据。
当然,垂直大模型很难从头做框架,这也是文心等平台的另一块重要收入,就是帮企业私有化大模型。“百亿和千亿两个版本大模型,只要客户方逻辑清晰,3个月测试,3-6个月即可落地,私有大模型部署成本在四五百万元。”有内部人士讲述百度文心大模型的市场化。
朱啸虎就提到,今年年初国内私有化部署大模型1000万人民币,年中500万,现在不到100万。私有化大模型和私有云一样,是个买卖型生意。而因此诞生的垂直大模型,则可以在医疗、交通教育等等不同业务中落地。
对于垂直大模型,此前有人认为,做通用大模型能够智能涌现,垂直大模型则难以实现。而行业声音则认为,垂直大模型利用独有数据训练,这是通用大模型再聪明也难以踏入的空白地带。
其实这种通用和垂直大模型之争,取决于ChatGPT等头部玩家的进化速度。类似Q*的出现,超级人工智能则不远。超级人工智能可能会迅速覆盖垂直大模型的能力,而如果大模型的进化速度不够快,则是私有数据决定垂直大模型的效果更好。
过去的应用与产品,尽管已经开始融入AI能力,但大模型带来的AI能力,还是让人眼前一亮。从2023年开始的这波AI热潮中,借助AI升级的产品公司主要分为两类。
第一类是巨头公司,旗下拥有多个数亿用户的互联网产品。借助大模型升级,让这些“传统”的互联网产品更性感。这类公司的代表是微软、Adobe和百度等。
来源:《AI一年,人间10年》PPT
微软由于一直投资OpenAI,在大模型应用领域也是近水楼台先得月。率先将搜索应用Bing升级为大模型版的New bing,同时将大模型应用于edge浏览器和Office套件中,而且将copilot定义为未来系统级的AI 助手。
受AI绘画冲击明显的Adobe,也在3月份的Adobe MAX 大会上,发布了3 款新一代的Firefly 模型:Adobe Firefly Image2 Model 、 Adobe Firefly Vector Model和Adobe Firefly Design Model,分别涉及图像,矢量模型和设计领域。
自今年 3 月发布首个 Firefly 图像模型以来,Adobe创意社区已使用该模型生成了 30 多亿张图像,其中仅上个月就生成了 10 亿张。Adobe曾对外表示,不仅生成图像的扩散模型是自研的,甚至文本生成的语言模型也是自研的。
不同于微软垂直于对话和Adobe垂直于图像领域,百度将其旗下几乎所有业务都在通过AI重构,百度搜索、百度文库、百度地图、百度网盘等。尽管产品不同,本质上都是智能搜索,这是百度的起家领域。
综合三家看,微软受益大模型最明显,在ChatGPT发布一周年之际,微软过去一年市值增加了约8000亿美元。而努力追赶AI浪潮的Adobe,过去一年,市值增加了约1700亿美元。而百度市值则略降100亿美元左右。
第二类是创业公司,他们本身拥有行业优势的AIGC业务,后续也推出了大模型业务,让原本的AIGC业务更智能。
诸如数字人独角兽公司硅基智能,在5月份发布了炎帝大模型,硅基智能将私有域知识用 LLM 大模型技术训练,叠加硅基 AIGC 数字人技术。
近期,硅基还完成了首个AI化大V-知名科普作家严伯钧。不同于常见的2D形象复制克隆人,本次将他以往发布的1400多条科普视频、100多万字的语料投喂给AI模型进行训练,实现严伯钧的肉体(形象、声音、动作)+灵魂(知识、表达)的全部AI化,相当于形成了数字生命,并且这个生命还可以AI进化,这背后就是大模型的力量。
目前可以看到,AI严伯钧每天可以高效地向全网1200万粉丝传播科普内容,而硅基的AIGC 数字人也已经通过了图灵测试,在不同领域做短视频和直播。
美图的修图、设计等老本行,和AGI也十分相关。所以美图在年中时候,发布了AI视觉大模型MiracleVision4.0版本,计划2024年1月时期,将MiracleVision4.0版本将陆续应用于美图旗下产品:美图秀秀,美颜相机,Wink,美图设计室,WHEE等App中。
美图的视觉大模型,几乎每两三个月更新一代视觉大模型。通过体验,实现了照片变漫画、基础海报AI设计等能力。但从Google的多模态大模型Gemini,被爆出宣传效果实际经过了剪辑造假,包括ChatGPT 4也在艰难地从语言大模型向多模态大模型能力进发,可以看出视觉等大模型进化并不容易。
大模型并不是AIGC企业营收的关键,但却是发展的必需品。正如国外的Jasper估值骤降为例,没有大模型的AIGC将没有壁垒,这在行业已经形成了共识。
大模型商业化的征途上,各流派都在各显身手。360公司曾经公布,其公司大模型半年曾创造2000万左右的营收。相比大模型的研发投入,其实这部分收入还比较小。各派的竞争,也没有显现出孰优孰劣。
当然,商业化模式也不是最终壁垒,因为模式会很快被复制,只有能力是Copy不了的核心。
来源:AI梦工厂
发布人:暖色
声明:该文观点仅代表作者本人,不代表火讯财经立场。火讯财经系信息发布平台,仅提供信息存储空间服务。
如文章涉及侵权, 请及时致函告之,本站将第⼀时间删除⽂章。邮箱:840034348@qq.com