文章转载来源:硅星人
原文来源:硅星人
图片来源:由无界 AI生成
12月中旬的周末,北京处在一场持续的寒潮里。每天的最高温度在-5度以下,积雪变成冰层结在路面上,车辆很少。我出门前问了问文心一言今天该如何出门,它说尽量选地铁,因为我大概率打不到车。
打车有点晚了。12月16日在751的大烟筒旁边,有一场大模型的创业大会。大模型仍然很热,聚集了上千名创业者,还有几十位企业CEO来了现场,台下是更多的想找一个跨向AI时代的正确姿势的开发者。李彦宏也去了。
在ChatGPT发布一年之后,文心一言升级到了4.0版本,它现在在网站和APP上叫做文心一言专业版,比起最初的版本,现在它能够完成一些多模态的任务,在逻辑和推理能力上已然不可同日而语。而这一年时间里,整个中国大模型的业态也发生了巨大变化,ChatGPT的惊艳变成一场场躬身入局。到了12月的这场降温里,我们似乎正在经历一场大模型过热。
截止今年10月,Hugging Face上已经有接近3万个文本生成模型可供下载,国内发布的大模型数量已经达到238个。6月份的时候这个数字是79个,相当于4个月就翻了3倍。但人们到现在仍然只记得那不超过10个大模型的名字。
一个围绕大模型的新产业正在形成,但李彦宏发现这个新产业里大部分人都用错了力,这让大模型进入一场资源盲目浪费的怪圈。
更直观明了的创新路径,原本应是在模型上开发AI原生应用,或者是用模型改造自己的现有产品,这却在疯狂烧钱、跑分的大模型热中被忽视了。应用才是大模型的价值所在,就像我们最初是从ChatGPT的惊艳故事里认识了OpenAI和它的大模型,而不是相反,或者从任何榜单跑分上。
李彦宏有些“着急”,关于大家仍然在卷基础模型,而还没有开始卷AI原生应用这件事。
这也不是李彦宏所经历的第一次AI浪潮。AlphaGo在2016年左右引发了全世界的关注,随后计算机视觉的火热又孵化出了一大批新的创业公司。但此前的百度一直保持着定力,飞桨的框架在形成,文心大模型在2019年拿出了第一个版本,但百度过去这十几年从来没有做过任何和用人工智能来下围棋有关的事,而对于计算机视觉带来的人脸识别或者智能巡检的想象空间,李彦宏又有所保留。
“即便你能够下得过全人类的围棋冠军,但这件事能产生的价值是很小的。而人脸识别或者智能巡检这样的场景又很分散,各种各样的场景你都要单独去做一套,一旦场景分散了,就意味着很难有标准化的产品出现。”
图源:百度
李彦宏从未像这次生成式AI的出现一样兴奋。
“这次大模型技术浪潮,我觉得不一样之处就在于它的通用性。我们讲叫“智能涌现”,没有教过的它也学会了。有了这个特点之后,当你有一套基础技术能够做得非常好、非常领先的时候,它在各种各样的场景都能够迅速做出有价值的应用来。这是AI过去70年从来没有过的事情,所以它是完全不一样的机会。”
技术终究是为应用服务的,而花费大量资源来打榜,甚至过分聚焦模型的基础能力都在某种程度上偏离了这样的原则。
“模型技术的先进性与否,更多的要看这个模型在什么应用场景下,能干什么。把这个东西想清楚了之后,才能够去评判模型的好坏。有时候我觉得模型好坏的评估能力是一个大模型公司的核心竞争力。你知道什么叫好,什么叫不好,你才能够做出好的来,如果你都不知道,你要靠第三方给你做评价,给你打个分,这个事儿是不靠谱的,你自己都不知道你在干啥?”
一篇论文做过统计,美国所有大学的GPU数量集结起来,都训练不出一个GPT-3.5。OpenAI用巨大的资源成本完成了生成式AI从0到1的探索,而在一年之后,李彦宏认为对于大部分大模型产业的参与者来说,现在已经过了“大力出奇迹”的阶段了,甚至更多走向它的反面。
“大模型到最后价值会落在应用上。这跟所有商业竞争规律都是一样的,谁的效率高谁胜出。你可以融资,我也可以融资,最后我用10块钱做出来100分的效果,你用10块钱做出来120分的效果,久而久之你就赢了。”
这也是百度内部在大模型应用研发时所坚持的一条效率路线,李彦宏拿百度文库的PPT生成能力举了个例子。
需求从具体场景中出现之后开始向下传递,然后文心大模型必须为这个需求去做优化,优化的时候遇到文心大模型调用成本的问题,再倒逼深度学习框架飞桨去配合模型层做调优,甚至需要调整芯片层去适配框架层的调优。这样一层一层端到端优化下来,现在百度文库PPT生成的推理成本基本上降低到3月份文心一言发布时的1%。
“从原来一天只敢调用一万次,到现在敢一天调用100万次,这是完全不一样的感觉。而我觉得这是未来竞争的主线。”
“我们需要100万量级的AI原生应用,但是不需要100个大模型。”李彦宏在11月提出过这样一个判断,一个月后这种感觉更强烈了。
PC时代,基本上只有Windows一个操作系统,但是基于Windows系统开发的软件有很多;移动互联网时代,主流操作系统也只有安卓和iOS两家,而移动应用有800万之多。如果把大模型看作类似操作系统的基础底座,那这个故事的终局可能只有一两个名字,以及无数在中途折戟的玩家。
李彦宏认为大模型时代将会延续这样的特征。人类进入AI时代的标志,不是产生很多的大模型,而是AI以各种应用为载体自然的进入人类生活。
李彦宏认为发展出好的应用有三个关键因素:
就像移动时代诞生了像微信、抖音、Uber这样的“mobile-native”的应用一样,AI原生时代一定会有优秀的AI原生应用是基于这些大模型开发出来的。在ChatGPT出现一年之后,无论是中国也好,美国也好,最好的AI原生应用还没出现。
而新的杀手级AI原生应用可能是一个全新的场景或创意,也可能先从对现有产品的AI原生化改造开始,这方面Adobe和微软已经有了值得借鉴的成果。
Midjourney、Stability AI这样带着生成式AI的设计工具并没有让老牌的Adobe式微。后者在今年10月拿出了世界上第一个专注于生成矢量图形的生成式AI模型,并且一口气宣布了Creative Cloud的100多项重大AI创新和更新,从今年3月推出Firefly图像模型的第一个测试版本到现在,Adobe的股价在不到一年时间里从300美元的水平起跳,几乎翻了一倍。
微软是一个不做大模型的公司,但却做出了现阶段最成功的AI原生应用Copilot,并且已经开始向用户收费,定价30美元一月,比整个OpenAI全年的收入要大很多倍。目前微软的市值已经到了2.8万亿,五倍于OpenAI。
图源:澎湃新闻
“大厂会拿走大多数的红利。”对于现在仍然无法完全把握的AI变革和新的AI原生应用的机会,李彦宏有这样一个判断。
“这里所说的大厂不是单指互联网大厂,而是现有几乎所有成型行业自己的大厂,这些当下生产力落后的公司一旦转过弯来,能够很好利用大模型能力的话,他们获得价值增益的总和一定是最大的。”
但这并不代表创业公司没有机会,“创业公司做出三五个Super APP是非常有可能的,做出几百个几千个非常有价值垂类的应用也是非常有可能的。”
而在这场尚未被定义的竞争中,从前做产品的成功经验,大厂的光鲜背景或是深厚的技术背景,可能都不是通向那个成功的AI原生应用的决定性因素。
“学习能力是最重要的”,李彦宏表示。
“我认为未来真正成功的AI原生应用产品经理,很可能不是某一类人,而是各类人的综合。我见到过的一些比较优秀的人,他学习的专业可能不是计算机科学,但他学习能力往往很强,有产品的感觉,有市场的感觉,同时又不怵技术。这种类型的人是最有可能成为成功的产品经理的。
李彦宏分享了一个他在百度内部对产品经理的看法细节:
“我有时候会听到百度的产品经理说,我们现在技术很厉害,我们的技术发展也很快,我一定要把百度最优秀的技术及时用到我的产品当中去。
我说,不行啊,大模型能力迭代太快了,我们现在最优秀的技术也是很不成熟的技术,一个月之后它就已经落后了。
所以产品经理自己要先明确业务需求是什么,然后去逼着技术团队把这个需求给我满足了——一定要给我做出来,你现在没做出来,OK,但是你要多长时间之内把它做出来,能提这样要求的PM才是合格的PM。”
用具体的需求去引领看起来“全知全能”的大模型往更有价值的方向进化,AI原生应用所有的机会和颠覆性都在这里。
来源:硅星人
发布人:暖色
声明:该文观点仅代表作者本人,不代表火讯财经立场。火讯财经系信息发布平台,仅提供信息存储空间服务。
如文章涉及侵权, 请及时致函告之,本站将第⼀时间删除⽂章。邮箱:840034348@qq.com