由于微信限制了第三方应用的跳转,请使用以下方法。

1. 点击右上角的

2. 选择在浏览器中打开

文心大模型4.0发布!宣称对标GPT4.0

转载
405 天前
2206

文章转载来源:极客公园

文章来源:极客公园

作者 | Li Yuan

编辑 | 靖宇

从搜索、文库到商业分析,AI 大模型成了百度的「纵贯线」。

欢迎来到生成式人工智能的时代!

2023 年 10 月 17 日,身着白衬衫和小白鞋,百度创始人、董事长兼首席执行官李彦宏在台上宣布了一个新时代的到来。

这场以「生成未来」命名的发布会上,李彦宏正式发布公司的大语言模型文心大模型的最新 4.0 版本,同时手把手教人们,如何用提示词,让升级的文心大模型应用,帮助人们用北京公积金在河北买房、制作广告和视频以及创造网文小说。

李彦宏在会上将文心大模型 4.0 直接和 GPT-4 对标|百度

在会上,李彦宏自信地表示文心大模型 4.0 版本的能力,「和 GPT-4 比毫不逊色」

同时,半年前宣布「所有应用都值得用大模型重构一遍」的说法,也在当天的会上有了结果。从主营业务搜索,到百度文库、网盘、地图等百度全家桶应用,都已经接入文心大模型,展现出更好的交互和逻辑能力。

在 B 端,李彦宏也曝光了 GBI(生成式商业分析)工具,以及大模型能力加持的办公助理「如流」。

如果说生成式人工智能激活了整个科技圈,那么百度可能是那个受益最大的巨头。


01 文心 4.0 直接对标 GPT-4


发布会一开场,李彦宏首先宣布发布了文心大模型 4.0 版本。

百度对于大模型的能力,划分了四个界定标准:理解、生成、逻辑和记忆。此次的文心大模型 4.0 升级,基础架构仍然与 3.0 和 3.5 版本相同,但宣称在逻辑和记忆的方面提升较大。

李彦宏公布文心大模型 4.0|百度

按照百度 CTO 王海峰的介绍,文心大模型 4.0 理解和生成能力的提升幅度相近,而逻辑的提升幅度是理解的 3 倍,记忆的提升幅度是理解的 2 倍

四个不同的能力,能够提升不同应用场景的效率。对这几大能力,李彦宏都进行了现场展示。

理解是对话式人工智能帮助用户的基础,在政务、营销、客服等等领域十分重要。

在理解能力上,现场用了一个语序颠倒,模糊表述的 prompt(提示词)来测试模型的能力:「我想回承德买房,能用公积金贷款吗?手续怎么办?我在北京工作。」

要理解这句话,AI 必须理解到「在北京工作」和「回承德买房」,其实具有「在北京缴纳公积金,而户口在承德。」这种极具中国特色的潜台词,才能做出准确的,用户需要的回答。而果然,文心一言迅速地理解了问题的关键,做出了正确的回答。

李彦宏阐释 AI 的四大核心能力|百度

而生成能力,主要可以提升品牌营销、文案策划和创意类工作的效率。

在现场,李彦宏展示了根据一张图片,用自然语言提示,就能进行背景转换,主体模糊处理,根据官网信息生成海报和文案等多种处理。

而除了这些传统的图片处理之外,此次百度还展示了视频的生成能力。通过自然语言的 prompt,在现场演示中,文心一言用几乎没有延时的速度,生成了一条数字人的口播视频广告。视频中融入了产品图,增加了许多过渡背景,还有一位身着西装的数字人不时出现,介绍从官网搜集来的产品特点。

现场展示文心大模型 4.0 的广告生成能力|百度

原本多个 AIGC 产品合作才能做出的效果,在这个展示中,无缝地实现了融合。一条广告片,5 个广告文案,还有一张海报,全过程生成只用了不到 3 分钟。

逻辑推理,通常表现为数学逻辑的测试。此次的展示,百度着重表现了它在教育方面的潜能。

李彦宏给出了一道涉及到锥形体积转换成长方体体积的应用题,文心一言不但给出了解答,同时能够按步骤解题,并分析出每个步骤中涉及到知识点。

用生成式人工智能给孩子辅导功课更简单了|百度

对于记忆能力的展示,百度的选择比较特别。

百度选择让文心一言撰写一个武侠小说的大纲设定。在撰写完成后,在原本的提纲上,让大模型增加人物关系,增加戏剧冲突,来展现大模型在增加了复杂信息之后,还能够记得原本的提纲设定和人物能力,没有漫无边际地发挥想象力。

百度也分享了文心大模型能力进步的技术支持。

百度之前就曾宣布,文心大模型是国内首次使用万卡集群训练的大模型,不少人猜测此次文心大模型 4.0 的参数规模预计突破万亿级别。不过,在此次发布会上,百度并没有强调大模型的参数级别。

除了万卡训练之外,百度 CTO 还提到了百度的算法训练稳定性的周均值已经超过了 98%,在输入和输出方面,都进行了知识点增强的技术


02「重构」百度全家桶


虽然进行了分别展示,实际上更多时候,大模型的四项基础能力是复合应用的。

5 月,百度就曾宣布利用大模型重构百度旗下的应用。而此次发布会上,百度也展示了百度应用文心大模型重构的最新成果。

其中,最惊艳的是对于搜索的重构。

2 月,微软就已经基于 GPT 的技术推出了 New Bing,对其搜索进行重构。而在最新的出庭证词中,微软的纳德拉表示自从将人工智能功能添加到 Bing 以来,微软在搜索市场的份额几乎没有变化。

微软的 New Bing 主要是推出了一个对话机器人的体系,可以与 New Bing 聊天提问来获得带链接的整合信息。谷歌的 Bard 也与此相似。

百度用 AI 重构主营业务搜索|百度

但百度此次推出的搜索重构则更加深入整个搜索体系。百度将其形容为「极致满足、推荐激发、多轮交互」。

极致满足体现在搜索框里输入问题,搜索可以不再是给出链接,而是直接生成一个最好的答案

在演示中,李彦宏提出了一个过去 20 年各国工业增加值排名是多少的问题。

不同于 New Bing 和 Bard 可能会给出一个带链接的数据答案,新的百度能够直接给出一个动态的表图,以条形图的形式,显示不同国家工业增长值。这个图甚至是动态的,会随时间进行增长和排名变化。

推荐激发功能有点相当于目前搜索引擎的相关问题,可以提示用户继续根据提示了解一些相关问题,如「工业增加值和 GDP 有什么关系?」「工业对国民经济发展有什么影响?」。

李彦宏分享 AI 重构百度全家桶应用心得|百度

而多轮交互也十分有趣。

目前的大语言模型创业浪潮中,其中有一个许多创业者都在努力的方向,就是利用大语言模型搭配推荐引擎,进行多轮对话,来向用户提供一个最佳选择。

9 月,百度举办的文心杯的创业大赛项目,其中的一等奖获得者 Buysmart.AI 是这个方向的佼佼者。用户用自然语言和点选,不断清晰自己的需求,而 Buysmart.AI 利用推荐引擎最终为用户推荐最需要的产品。

而重构后的百度搜索,直接在搜索中增加了类似方向的功能。

在演示中,百度的搜索提示词是询问「北京周边登山去哪好?」而搜索引擎在给出了百花山、海坨山等等多个答案后,允许用户进一步点选补充选择自己的情况。比如如果选择徒步新手加亲子,搜索引擎就会改为改为推荐西山和百望山这样的地点,它们相对好爬,对亲子活动也比较友好。

除了搜索的重构之外,百度还展示了对于百度网盘、百度地图、百度文库等应用的重构。

百度网盘的云一朵个人云助理,在之前就已经推出。作为世界上第一个个人云助理,目前用户已经达到 2000 万。可以用自然语言与助理沟通,一句话操作找到个人云中的某段视频,对于视频内容进行理解,找到视频中的某项内容,总结出视频的金句等等。

百度地图,按照百度的宣传,是全球首个 AI 原生地图产品。通过与地图的助手对话,可以一步直达多级菜单的几千个服务。也可以推荐地理位置合适的餐厅,对比餐厅的环境进行选择,最后直接约车。

百度文库依托十亿过去的文稿资源,可以直接在用户对特定题材搜索资料后,勾选需要的文章类型,严肃学术文献或是普通大众材料,进行一键文章生成。

重构后的百度文库还添加了 PPT 生成的功能,能够理解观点之间是并列关系还是递进关系,进行 PPT 风格风格一键切换,百度宣称「远超市场上其他 PPT 生成工具。」


03 发力 B 端


在此次的演示中,百度还展示了一些全新的 B 端应用。

其中,此次百度重点推出的是一个商业智能产品。百度 GBI,Generative Business intelligence。

这是一个百度推出的全新产品,是国内首个生成式商业智能产品,具有支持自然语言交互、跨数据库分析和专业知识学习三方面能力,将商业分析师十几天才能完成的数据分析工作缩短到分钟级。

瞄准 B 端的百度 GBI 产品|百度

在广告片中,面对「成本本预估是多少?不亏钱的价格底线是多少?客户要求我们 3 个月内完成交付,能做到吗?最快多久?如果竞对,比如我们的报价低,有什么办法?」这一系列相关的财务分析、项目交互、用户分析的问题,百度 GBI 可以直接通过自然语言对话,给出答案,并生成图文并茂的回答。

不需要专业人士进行操作,跨数据库和表格接入数据也不需要额外的操作。除此之外,企业还可以对其训练,让其学习专业知识,成为行业专家。

另一个 B 端产品是如流。使用生成式 AI 进行重构后,如流可以一键生成会议纪要,总结上千条工作群的内容。结合企业的 CRM 系统,为管理者提出项目背景和项目谈参。根据个人行程,规划工作计划,发出会议邀约等等。

除了赋能办公方面,百度还展示了大模型对于自动驾驶、智能座舱和政府智慧监控项目的赋能。

发布半年多以来,文心快速迭代,重构百度应用,同时在逐步建立文心生态。

百度也在发布会上介绍了近期上线的灵境平台。无论是个人或者企业的数据或者是应用,都能够在灵境平台上快速变成一个插件,利用 api 接入文心大模型的能力中。

李彦宏预言即将到来的 AI 生态时代|百度

百度介绍,目前灵境平台上线一个月的时间,已经有 2.7 万个开发者的申请入驻,覆盖了 20 多个领域,包括法律咨询、简历生成,脑图制作、口语练习等等各种各样的场景的原生应用。企业私有数据在没有泄露风险的情况下,也能够方便快捷地接入最先进的这个大模型的能力。

中国有丰富的应用场景,中国用户又天然愿意拥抱新技术,有了先进的基础大模型,我们就能构建起一个繁荣的 AI 生态,共同创造新一轮经济增长。」李彦宏表示。

64x64

SolanaETF获批前景:从“几乎无望”到“2025年底前可期”,当前有哪些挑战?

App打开
64x64

专访Polkadot缔造者GavinWood:因过于超前经历了哪些误解和挫折?

App打开
64x64

交易机器人存在的跑路风险,UTONIC的AVS+MPC方案可以解吗?

App打开
更 火 的 区 块 链 资 讯
分享自火讯财经-长按识别快讯真伪
长按图片转发给朋友