生成式AI,能否生成百度的未来?

转载
391 天前
6751
光锥智能

文章转载来源:光锥智能

原文来源:光锥智能

作者:刘雨琦

图片来源:由无界AI生成

大风始于青萍之末,命运的偶然和必然经常会纵横交织在一起。

2019年,是整个人工智能历史上,最为晦暗的一年。继2016年AlphaGo打败李世石,2017年Tansformer架构横空出世使得技术大规模爆发,2018年的创业热潮之后。2019年,资本退潮、技术瓶颈期、场景难落地,开启了人工智能史上的“乱纪元”。

没有人知道通用人工智能何时到来,就像三体人不知道太阳会在何时升起。

那一年,大批AI公司陷入裁员风波、资金链断裂、产品难产,能坚持至今的,所剩寥寥。

但也正是在2019年,AI新的希望开始孕育:OpenAI在7月接受了微软的投资并与其深度合作,如今让世人震惊的GPT-3正是从那一年开始研发;国内最早树立AI战略的百度,从年初就开始进行了一次长达半年的人事调整,如今看来,重新排兵布阵,似乎是开启了长达4年的坚守期。

2019年,王海峰晋升为集团CTO,继续担任AI技术平台体系(AIG)和基础技术体系(TG)总负责人,两者是百度最重要的技术底座;沈抖晋升为高级副总裁,全面负责移动生态事业群,随后在2022年又调任至百度智能云,成为百度第二增长曲线的开拓者;而在2019年引进的一批新生力量中,何俊杰是唯一一名80后百度副总裁,先是负责投资并购和战略投资,后又被重用,负责沈抖空缺出来的移动生态事业群,实权更加在握。

时间来到了2023年,Transformer的能力在这一年终于由OpenAI打破了天花板,进阶到一个新的层次,技术的突破让OpenAI一举成为全世界最受瞩目的公司。微软盖过了谷歌的科技光辉。

在过去四年里,百度的核心业务形成了由沈抖领军智能云,何俊杰负责移动生态,王海峰压阵技术的三角结构,百度也终于结束了静默期,开始转守为攻,动作不断。

“重新把每个应用都做一遍”,是经历了半年蓄力后的第一次亮剑,如今的百度像一颗行星,即将遇到巨大的“技术引力场”,而彻底改变轨道。


大模型涌现前夜


2017年,谷歌在一篇名为《Attention Is All You Need》的论文中,提出了Transformer架构,以替代传统的RNN和CNN循环模型,论文中展示了Transformer的训练准确性高于之前所有模型,训练时间明显低于之前的模型,在训练集内容较少时训练效果也很好。

这之后,Transformer架构迅速被接受并应用在了NLP和CV领域,尤其在NLP领域,注意力机制让机器能够更准确地理解语义并生成,以及减少信息重复。

作为最早一批发现并跟进Transformer技术路线的公司,百度已经在NLP领域研究超过十年之久,并已经组成了一支由王海峰、吴甜、吴华等顶尖专家组建起来的精悍的NLP队伍。

王海峰

彼时,NLP团队成立的第一个重要任务,是打造百度翻译。王海峰将深度学习和神经网络大胆应用在翻译中,加强机器对上下文的理解,形成更流畅的译文。这一勇敢尝试也让百度翻译成为第一个支持200多种语种的翻译系统,甚至比Google还早了一年零3个月。

这也是大模型四大核心能力“理解、生成、逻辑、记忆”中,理解能力的雏形。

但王海峰觉得,NLP还不够。他专门跑到李彦宏办公室去做汇报,提出了下个“登陆的诺曼底”——语音识别。他的理由是,语音识别技术马上要到产业化的临界点,一旦突破很快就会大规模商用。

李彦宏凭借着自己对技术的判断,决定再次支持王海峰,陆续建立了与NLP部门平行的“语音识别部门”、“图像识别部门”和“知识图谱部门”。

王海峰的一通操作让很多百度的同学不解,“这些技术和百度现在的产品也没关系啊,一股脑创建这么多部门,是攒着过年么?”

彼时的王海峰,正是看到了搜索数据对于大模型形成逻辑有着非常强大的支撑。“百度有世界上最大的搜索引擎,搜索引擎不仅信息时效性很强,也有很高的准确率,可以构建最全的知识图谱”,王海峰曾在公开采访中解释道。

在打造文心一言之前,百度沉淀了拥有超过50亿实体、550亿事实的多元异构超大规模的知识图谱,能够通过语言、听觉、视觉等获得对世界的统一认知。其在2021年发布的知识增强大模型——ERNIE(文心)3.0,正是文心一言的前身,该项目由吴甜主要负责。

吴甜

又是2019年,百度文心1.0发布,在4年时间里迭代了3个版本。2022年11月,吴甜在公开峰会中同时公布了文心已经累计的11个行业大模型,涵盖电力、燃气、金融、航天等领域,产业生态初步形成。

这些,都为百度抢先发布文心一言做了伏笔和铺垫。3月16日,文心一言发布之后,百度再次回到镁光灯下,但比肯定更多的,是质疑。

“市场需求这么旺盛情况下,谁先做出来还是意义非常大的”,李彦宏曾在采访里讲到,即便产品并未完全成熟,但仍然要发布的原因:“文心一言发布之后,无数的人,过去不怎么联系或者行业跟我隔得很远的人都在问,我们怎么能跟百度合作,怎么尽早试用”。

从技术的角度,大模型更是“越用越灵”的高速迭代。“内测的时候,员工问,文心一言怎么藏头诗写不好?我说等等吧,明后天估计就能学会了,结果第二天果然就能用了,大模型的进步也是一个不断学习的过程”,王海峰笑道。

在半年时间里,文心一言从3.0到3.5,再到4.0版本进行了三次迭代,据王海峰在会上介绍,文心一言用户规模已经达到4500万,开发者5.4万、场景4300个、应用825个、插件超过500个。

在NLP浇的水,施的肥,终于在2023年迎来了丰收,也正如李彦宏所讲,技术发展的路径,是“一生二、二生三、三生万物”的过程。


大模型背后的内功

通用人工智能爆发之后,云计算的关注度和企业重视程度到了顶峰,也随即来到了“iPhone时刻”。

大模型的出现,产生了巨大的算力缺口,云计算既为大模型提供云算力支撑,又是大模型落地企业的最佳着落点,无论是百度还是任何一家拥有大模型的企业,当大模型面世,下一步的重点便是推向市场,让企业用起来。

对于百度而言,这样的重担,落在了沈抖肩上。

沈抖

在百度的六大事业群负责人中,除了CTO王海峰,沈抖是唯一一个高级副总裁。虽然同为技术出身,但和王海峰的“工程师”角色不同,沈抖从加入百度开始,就一直在负责关键业务的增长。

加入百度的10年里,沈抖先后整合了广告投放系统,提高了系统变现能力;将搜索和feed信息流进行结合;整合了由搜索升级后的移动生态事业群,补齐了百度移动生态的版图。

如果说,王海峰打造了一把尖刀,那沈抖则是能利用这把尖刀,开拓疆土的先锋官,用李彦宏的话说是“敢打硬仗、能打胜仗”。

2022年5月,沈抖轮岗为百度智能云(ACG)事业群总裁。于百度而言,最开始并没有全力押注云计算,但也正是随着人工智能技术的不断发展,让百度意识到了云计算短板后,开始暗自发力,默默培养第二增长曲线。

由于没有先发优势,百度云过去10年的目标都十分明确,不和“老炮”们比拼IaaS层的规模化,而是通过PaaS+SaaS与智能化能力的结合,打出差异化,并以小搏大地切入企业数字化。

2023百度世界大会上中,沈抖再次提出“云智一体”战略:“人工智能与云计算的深度结合是企业快速落地AI原生应用的关键。目前,百度集团所有应用和服务全部基于‘云智一体’技术架构运行在百度智能云上”。

据光锥智能观察,云智一体战略的核心在于,一方面,以百度智能云为依托,可以快速为企业提供整套的大模型服务;另一方面,大模型也推动着企业数字化的门槛变得更低。

在接手ACG后的5个月里,沈抖针对企业在大模型时代的核心需求,迅速整合出了“大模型服务超级工厂”——文心千帆,并按需求将用户分为五大类用户。

首先,针对算力资源所产生的需求缺口,千帆平台提供各类异构算力。比如在耗费最多训练环节,通过分布式并行训练和微秒级互联能力,千帆平台可以实现万卡集群训练加速比达到95%,有效训练时间占比达到96%,大幅降低客户算力和时间成本。

其次在模型层面,对于希望直接调用已有大模型的客户,企业可快速调用包括文心一言在内的多个大模型,同时千帆平台提供中文增强、性能增强、上下文增强等工具。据沈抖透露,目前千帆平台已经服务超过1万7千家客户。

针对有二次开发需求的客户,千帆平台为大模型提供再训练、微调、评估和部署等全生命周期工具链,业界最多的41个高质量行业数据集,并针对自身业务场景快速优化。

大会现场还进行了如何基于检索增强生成(RAG,Retrieval Augmented Generation)框架,为三一重工快速开发知识问答应用的实操演示:只需在千帆AI原生应用工作台中选择预置的RAG框架,进行相应的参数配置等工作,就可以快速实现三一重工官网智能客服应用的开发与上线。

沈抖表示,搭建这样一个“小助手”,即使需要处理几千篇万字长文档,成本也只需几百块钱;而之后用户每次咨询,成本仅需几分钱。

一直以来,大型工业、制造业、农业都是数字化的深水区,核心原因就在于产业的复杂性导致了数字化的门槛高,难以落地。

但通过大模型,既降低了使用门槛,也降低了使用成本。不需要打造任何新系统,也不需要人工参与,是技术组件的一个更高级的应用方式,二者结合,也转起了云智一体的飞轮,逐步蓄力。


大模型的创新挑战

 过去已成定局,未来却可以改变。

所有拥有了大模型的厂商,都发现了应用层的机会。微软在3月份就开始动刀包括Bing、Office、Windows系统在内的全线产品,阿里张勇讲道:“要用大模型把所有产品重做一遍”,然而这句话,说起来简单,做起来却是大模型时代最大的创新挑战。

AI如何重构应用?这不仅要业务能力,更需要想象力,面对一个新的AI时代,百度也将指挥棒交到了年轻人手里。

2022年5月之后,接替沈抖作为MEG事业群负责人的,是百度人才梯队建设计划中引入的80后副总裁——何俊杰。如果说沈抖是“硬战派”,那何俊杰就是名副其实的“少壮派”。正如任正非所说,要“让听到炮声的人指挥战斗”。

重构应用,是不破不立,对比来看,百度对自己,确实“下手特别狠”。

百度世界大会,围绕“生态”,何俊杰交出了“移动生态”、“内容生态”和“商业生态”的答卷。

其中,移动生态涵盖了“新搜索”、“新文库”、文心一言APP、百度电商“慧播星”等AI原生应用;内容生态层面,通过百度APP“AI编辑器”等一系列应用为创作者生态赋能;商业生态层面,推出AI Native营销平台“轻舸”。此外,何俊杰还公布了文心一言插件生态——“灵境矩阵”,现已全面开放。

百度所定义的新搜索,正是延续了2010年李彦宏提出的框计算的逻辑。具备极致满足、推荐激发和多轮交互三个特点。即用户搜索问题时,“不再给你一堆链接”,而是通过对内容的理解,生成文字、图片、动态图表等多模态答案;推荐激发则可以实时推荐用户关心的问题;在针对复杂需求时,多轮交互可以通过提示、调整等方式,满足用户个性化的搜索需求。

需求到匹配的过程,也称之为“端到端”搜索,但这会打破百度曾经赖以生存的竞价排名模式,广告收入也是一直以来百度最大的现金牛,自己革自己的命并不简单,百度后面还有一场硬仗要打。

AIGC的能力让一部分百度老应用有了新的活力,比如百度文档从内容检索工具升级为了内容生产工具、百度编辑器成为了内容生成工具;另一部分也探索了新的场景,比如百度轻舸通过AIGC一站式生成营销内容并智能投放,结合数字人生成平台“慧播星”帮助商家扩大营销范围和场景。

同时,随着大模型应用的逐步落地,百度也意识到凭借一己之力终究有限,无限的是合纵而连横。

这正是灵境矩阵的价值所在,这一平台大大降低了大模型插件开发的成本,让有创意、有想法的普通人,也能成为插件开发者。李彦宏表示,插件是一种特殊的AI原生应用,也是门槛最低,最容易上手的AI原生应用。

插件的特点在于“万能接口”,既可以连接搜索、小程序、内容平台也可以连接任何入口,这样“即插即用”的使用方式,能让开发者、创作者快速加入到生态中。

何俊杰透露,上线一个月,灵境矩阵已经收到2.7万个开发者注册申请,覆盖了20多个垂直领域,其中包括企业、机构和个人开发者。

一位百度内部人士告诉光锥智能:“应用层的大模型插件以灵境为主要平台,会放在文心一言和百度App中。千帆更偏底层调用,灵境更偏上层,甚至未来有可能在应用插件层面会替代千帆”。


结语

2016年,李彦宏曾说,百度离破产只有30天。“恐龙脚上踩到一个瓢,几个小时以后他的脑子才能反应过来。所以不管恐龙长到多大,都会灭绝”。

百度不想做恐龙,在意识层面,总是想着十步以外。

幸运的是,百度等到了新时代,度过了最艰难的时刻;不幸的是,在这个新时代的开端,任何费劲心力的抢跑,都会在漫长的竞争下显得微不足道。

但拿到了新的船票,至少是一个新的开始。

资料参考:

https://blog.csdn.net/futuregislab/article/details/129619234《人工智能各领域跨界能手——Transformer》

https://zhuanlan.zhihu.com/p/343409729《此行向远:他们为人工智能雕刻灵魂》