李飞飞、吴恩达开年对话:AI寒冬、2024新突破、智能体、企业AI

转载
312 天前
3787
机器之心

文章转载来源:机器之心

来源:机器之心

图片来源:由无界 AI生成

李飞飞、吴恩达畅谈 2024 AI 趋势。

在人工智能发展史上,2023 已经成为非常值得纪念的一年。在这一年,OpenAI 引领的 AI 大模型浪潮席卷了整个科技领域,把实用的 AI 工具送到了每个人手里。但与此同时,人工智能的发展也引起了广泛的讨论和争议,尤其在其商业应用和未来发展前景方面。

著名 AI 专家 Rodney Brooks 在 2024 年初发文预言,认为 AI 可能即将进入一个新的寒冬,随着泡沫的破裂,行业可能面临严峻的挑战。他的这一言论引发了业界的广泛讨论:新的一年,AI 领域将会迎来更多的炒作,还是进入低谷?与此同时,还有不少人担心,AI 是不是会取代更多人的工作?

在前不久的国际消费类电子产品展览会(CES)上,两位著名 AI 科学家、斯坦福大学教授李飞飞和吴恩达以此为契机展开了讨论。此外,他们还讨论了:新的一年,哪些 AI 技术将迎来新的突破?AI 智能体的崛起意味着什么?对生成式 AI 准确性存在顾虑的企业要怎么用好这项技术?

点击查看原视频

为了方便大家收藏具体内容,机器之心还将视频整理成了文字版:  

主持人:首先我们来讨论一下第一个问题,这个问题与人工智能的当前状态有关。去年无疑是人工智能炒作非常疯狂的一年。

我们的好朋友 Rodney Brooks 在 1 月 1 日发推说:「现在该穿厚衣服了,可能又一个人工智能寒冬即将来临,而且会非常寒冷。」那么,在新的一年,AI 领域会迎来更多的炒作,还是低谷呢?

吴恩达:我认为媒体会按照它们的方式去做事。但我们并不会进入寒冬,因为人工智能的商业基础比以往任何时候都要坚实,甚至在生成式 AI 浪潮来临之前就已经如此。去年,人工智能真正起飞了。它可能推动了数千亿,甚至数万亿美元的市场,这点我不确定。至少对像谷歌这样的公司来说是数千亿美元,因为展示更相关的广告可以带来大量的收入。所以 AI 的商业基础是存在的

其实,关于人工智能,最难理解的一点是,它是一种通用技术。这意味着它不仅仅对一件事有用。它有点像电力这样的通用技术,如果我问你电力有什么用,你会觉得很难回答,因为它的用途太广了。人工智能也是如此。就我们今天所处的阶段来说,即使人工智能无法取得任何技术核心进展,当然它肯定会取得进展。即使没有,世界各地都有很多用例等待被发现和构建。所以我非常有信心,它的商业基础将继续壮大。

李飞飞:是的,我大体上同意 Andrew(吴恩达)的观点。我们看到的是人工智能的另一个拐点,这个拐点始于大型语言模型的发展,特别是 ChatGPT 的首次推出以及后续模型的推进。

我认同 Andrew 的看法,AI 是一种深化的横向技术。作为一种深化的横向技术,它正成为下一次数字革命或工业革命的重要推动力。公共媒体的报道,会呈现波动,但这不是最关键的。重要的是,这项技术已经根植于我们的生活。它正在深入到所有垂直行业和消费者体验中,逐渐改变我们的社会、经济和政治结构。这是不争的事实。而且这种改变正在变得越来越明显。

主持人:让我们跳到你们对 2024 年重大突破的预测。你们认为今年 AI 的最大突破会是什么?

李飞飞:预测未来总是非常危险的,因为我说错的话会被引用。从计算机视觉和所谓的以像素为中心的 AI 领域来说,我确实认为我们正处于非常激动人心的技术进步的边缘。我们一直在关注生成式 AI,我们一直在研究扩散模型,有人可能听说过 Gaussian splatting 或这方面的内容。我认为目前的技术浪潮中,有许多成果几乎就要实现突破了。我不确定它是否会像一年多以前的大型语言模型那样成熟,但我越来越多地看到这一点。我对此非常兴奋。

主持人:Andrew,你怎么看?

吴恩达:是的,我也有几个预测。首先,我们看到了大型语言模型的突破。我同意飞飞关于图像的看法。所以我看到的是,从大型语言模型到大型视觉模型的转变。很多进步不仅仅在于图像生成,图像分析也在进步,它能提高计算机的视觉能力,这对自动驾驶汽车等领域有很大的影响,比如任何带有摄像头的地方。这是第一点。

第二点我想说,你向 ChatGPT 提问,它会立即作出回应。但我更感兴趣的是自动化智能体的崛起。当你给 AI 系统一个指令,比如说「亲爱的 AI 系统,帮我做市场调研,对这个公司进行竞争分析。」智能体不会立即给出回应,而是规划一系列动作,比如进行网络搜索、下载网页、总结信息。它会去做半小时、一小时或一天的工作,然后带着答案回来。自动化智能体能够规划和执行一系列动作。它们现在刚刚起步,但在研究和商业化方面有很多进展。我期待在接下来的几个月里,会有新的突破。

最后一点,可能也适用于 CS 领域,我对边缘 AI 非常感兴趣。我经常在我的笔记本电脑上,运行大型语言模型。我经常用 GPT-4,也经常用 Bard。但很多人不知道的是,在你的笔记本电脑上运行大型语言模型实际上已经相当可行。虽然这些模型不像 GPT-4 那么大,但也够用了。我认为这件事意义深远。所有的 PC 制造商,难道不会想要销售给消费者一个更强大的 PC,让他们使用最新的 AI 技术吗?显卡通常是人们升级电脑的一个动因。我认为在你的笔记本电脑、PC 或你的工业 PC 上运行的边缘 AI,它的能力实际上比大多数人认为的要好得多。对 CS 领域来说,我认为这将推动很多设备的销售。

李飞飞:我有一点点不同的意见。你提到了「自主智能体」,但我更倾向于将其称作「辅助智能体」。我们在当前的大型语言模型和这些庞大的基础模型中观察到,处理长尾问题依然是个挑战,无论是在幻觉现象还是其他方面。在很多工作环境中,为了提供高品质的服务和产品,关注长尾分布非常重要。因此,我认为更可能出现的是人机交互式协作。在这种模式下,辅助智能体既包含了自主工作的部分,也包含了与人类的协作部分。这比完全自动化更有可能成为现实。

吴恩达:确实如此(击掌)。我其实在一定程度上同意你的看法。我想分享我的经历。「自主智能体」这个词可能有些问题,但我在商业领域看到的是,大多数人更愿意让 AI 辅助人类,而不是替代人类,尤其是考虑到失业的问题,这是一个现实挑战。我不想忽视那些失业者的苦难。

我观察到的是,决定是否使用 AI 来自动化或取代人力,通常更多是基于商业经济来考虑,而不是基于伦理。或许这应该是一个伦理决策,但诚实地说,当我与企业合作建立聊天机器人时,我看到大多数企业都会进行非常理性的经济评估。人类能够带来这些价值,人工智能能够带来那些价值,他们关心的是怎么做是最佳的经济决策,毕竟竞争者也在做相同的事情。我希望我们能说「不要取代人类的工作」,但不幸的是……

主持人:关于这种类型的 AI 智能体,我想引用 Mira Murati 的一句话。她说,「AI 智能体的概念并不新鲜,但现在我们正在向未来迭代,发展出具有智能和常识的智能体,它们理解我们为什么要做某些事情。」

李飞飞:好的,我想补充一点,也对那个观点发表评论。我认为我们需要谨慎区分取代「工作」和取代「任务」。我相信,你我都看过相同的报告。报告表明,人类的每项工作实际上都是由多个任务组成的。我花了很多时间研究医疗保健。一名护士在值班的 8 小时里要完成数百项任务。AI 智能体确实在许多任务中发挥辅助和增强的作用,但我们需要慎用「工作」这个词。我确实认为,经济商业决策与伦理社会决策并不是互斥的。这是一个更深入的讨论,我知道你和我意见是一致的。

回到你关于这些智能体有理解能力的问题。我认为这是一个非常微妙的术语,仅关注商业方面。什么是理解?有对数据中存在的模式的理解,有对你所做决策的理解,还有对任何人类任务意图的理解。所以,实际上,我不会简单地用一个笼统的「理解」这个词来描述今天的 AI 智能体。

主持人:你认为 AI 智能体会在何时达到什么程度?

李飞飞:我认为我们目前做得最好的是理解数据中的模式,尤其是当我们有大量的训练数据时,我们做得非常好。我指的是大型语言模型,使用基于序列到序列的基于 transformer 的算法,我们真的做得很好,从数据中提取模式,以创造强大的预测模型。所以我认为,这可能是最前沿的。再次强调,我认为「理解」要微妙得多。你们都来自商业领域,知道其中的细微差别,我认为还有更多工作要做。至于意图理解,我认为我们只是触及了表面

吴恩达:我想回到任务的话题,因为我认为这很重要。我的团队为很多企业工作,偶尔我会接到首席执行官的电话。他们说:「嘿,Andrew,我读了关于 AI 智能体的文章,我该怎么做?」结果表明,有一种方法,它能帮助企业确定哪些任务应尝试用 AI 增强或自动化。正如飞飞所说,大多数工作由许多不同的任务组成。以放射科医师为例,放射科医师阅读 X 射线影像,他们需要获取病人的病史,操作机器、维护机器、指导年轻医生等等。所以放射科是一个例子,涉及许多不同的任务。我所见过的企业做法是观察你的团队,了解你所有员工实际上在做什么任务,并且不是在职位层面,而是在任务层面分析。这项任务在多大程度上适合用 AI 去增强或自动化以及业务投资回报率如何。每次我和企业一起做这个工作时,我们总是能想出很多点子,但我们没有时间去实施。所以 AI 的增强或自动化有很多机会

我学到的第二点是投资回报率最高的任务,往往不是人们最初所想到的那个。以放射科医师为例,人们通常会想到,哦,放射科医师就是看 X 光片的。这是你的脑海中关于这个职业的定位画面。但当我们去分解这项工作时,我们会发现有很多其他任务,比如收集病人病史之类的。这些任务可能更容易实现,而且投资回报率更高。所以我发现,系统地进行这个练习,通常有助于企业识别有价值的机会,然后进行构建与购买的决策,执行 AI 项目。

主持人这正是我想谈的下一个话题。让我们讨论一些更加实际的问题,在与财富 500 强公司的合作中,你有没有发现,那些有着清晰的、可证明的、可实现的投资回报率的应用都有哪些共性?比如,你觉得这个房间里的大多数人应该专注于哪些应用?

吴恩达:如果我们广泛观察财富 500 强公司,我认为常见的应用是客户运营或客户支持。有很多公司试图增强或自动化客户支持。我认为软件工程也在转变。我们对软件工程师的支持远远超出了 Github Copilot。Github Copilot 是一个不错的工具,但我们能做的远不止这些。我认为销售运营也受到了很大影响。但对于特定企业而言,几乎每家公司都在做客户运营,所以你也应该认真考虑这个方面。但更激动人心的事情是,我和一家非常大的农业公司谈过,我们确定了一些任务。这不是你想到的那种收割任务,而是一些奇怪的任务。我们认为或许可以使用 AI,来大大节省他们的时间。所以,适合你的业务和行业特色的小众领域,我认为通常更引人入胜。它们不仅有趣,还能创造出特定于行业的防御性飞轮效应。因为每个人最终可能都会购买一些通用的销售运营工具等,但那些特定于你业务的东西,你应该在内部构建,我觉得这些事情非常令人兴奋。

李飞飞:现在确实有各种各样的客户支持或运营解决方案。但我想补充的一点是,我们还可以在当前技术中寻找共同的机会。我认为有个结论今天依然成立,那就是,在数据最丰富的地方,你可以从中识别出可重复或有效的模式,无论是人类语言模式、结构化数据模式还是图像数据模式。数据所在的地方,以及数据模式被证明在你的业务中有价值且可操作的地方,就是你应该关注的地方

主持人:让我们谈谈财富 500 强 CEO 可能面临的障碍。我们上周日举行了医疗保健峰会,会上有几位医疗保健 CEO 出席。我们问其中一位,你对数字创新最感兴趣的是什么?他说人工智能。然后我问他,作为 CEO,你最担心什么?他说,不准确性。

李飞飞:这是最难的行业之一。

主持人:你想对那些将不准确性上升为 CEO 级别关切的 CEO 说些什么?在你看来,还有哪些问题可以上升到这个级别?

李飞飞:就像我之前所说的,这取决于你的产品、你的服务以及结果的利害程度。在医疗保健、金融预测等许多行业中,长尾精确性非常重要。你不能承受人命损失或人身伤害,你不能承受银行出错。所以你需要了解你的行业,了解你的解决方案和服务,看看 AI 可以在哪里发挥真正的作用。这就关系到你说的炒作。当我与商业高管交谈时,我们应该摒弃炒作,理解这项技术能做什么,避免投资于那些 AI 还不擅长的方向。

主持人:那么飞飞,类似医疗保健这种涉及生死和高度监管的行业,他们想用生成式 AI,但又担心准确性问题,你想对他们说些什么?

李飞飞:Andrew 和我都在医疗保健领域工作了很久。实际上,医疗保健中有大量的 AI 应用,从非常上游的药物发现开始,我们可以做很多事情。

主持人:我想说的是生成式 AI

李飞飞:这是一个信息过载的词。今天,每种 AI 都被称为生成式 AI。在 Andrew 和我的早期研究中,我们有非常具体的数学定义来定义生成式 AI。但现在,我们……

吴恩达:我们之前管它叫机器学习,但机器学习……

李飞飞:我们还曾经区分生成式 AI 和判别式 AI。如今,这种数学严谨性已经消失了。

吴恩达:是的,我觉得大众媒体已经接管了技术术语。技术界也只是跟着适应。

李飞飞:确实如此。所以,当你说生成式 AI 时,我假设你指的是那种大数据驱动的有预训练阶段的模型。有些人可能会将 transformer 和预测模型纳入其中,但我不确定是不是总是这样。但无论如何,我认为如果真的存在准确性问题,我们应该检查几个方面,比如这是模型的问题,还是数据质量的问题?是因为把 AI 引入流程才有了这个问题吗?导致结果不准确的商业问题有很多。你要弄清楚这些问题,并尝试解决它们。有时候,例如在某些医疗诊断和治疗层面,你确实需要认识到限制的存在,如果风险太高,我们不能过度推进。

吴恩达:我补充一点,虽然我们使用 “生成式” 这个术语。但 AI 往往用于分析。我的团队已经做了很多项目,比如使用这些大型语言模型来阅读电子健康记录,试图得出结论,而不是撰写文本。即使你在写文本,如果你小心使用总结软件,也能得到不错的结果。它可能还会有一些错误,我认为在医疗保健环境中,如果某个场景风险不那么高,还是有很多部署这些技术的机会的。

就诊断来说,如果你弄错了一些东西,那结果是很糟的。但我们部署了一个系统,目前仍在一家医院运行。该系统用于筛选患者、阅读电子健康记录,判断谁的死亡风险更高,并推荐他们考虑接受临终关怀。但我们无法信任系统做出的决定。所以我们把它送给医生,让医生复查我们展示的病例,并做出最终决定。

实际上,我新加坡的一个朋友正在使用新加坡国立大学的一个系统,查看病人的电子健康记录,尝试估计病人将在医院待多久。有时医生会认为这是个简单的病例,三天内就会出院,但 AI 说不,需要 5 天。这就引发了进一步的讨论。这就是新加坡正在发生的事情。医生说,「哦,也许我需要再仔细看看这个病人。也许我漏掉了 AI 发现的东西」所以,这些东西实际上正在部署。但根据系统的能力,我们通常可以设计安全措施,确保以负责任的方式部署 AI。

在医疗保健运营中,如果你使用 AI 来安排核磁共振机的试用,即使你犯了错误,导致核磁共振机使用效率降低,这虽然很糟,但也许并不像弄错关键诊断那么糟糕。所以实际上,AI 在医疗保健领域有很多部署机会,我认为几乎所有行业都是如此。

主持人:那么,我们接下来讨论基础模型。这个问题的灵感来自我在科技网站上读到的一篇文章。如果说 2023 年是 OpenAI 高光之年。那么,在基础模型的领导者中,2024 年的主角将是哪个公司?苹果会推出 Ajax 大模型吗?我们对 Gemini 的关注会多于 GPT 吗?

吴恩达:事实证明,每当出现一波技术创新时,媒体都喜欢谈论技术层面。所以媒体会关注 OpenAI、谷歌、AWS、微软、Meta、英伟达、AMD 等公司。这没什么问题。但事实证明,要让技术基础设施层成功,我们还需要成就另一个领域,那就是建立在这些技术提供商之上的应用层。坦白说,我们需要基于这些工具构建的应用来产生更多收入,以便它们能够为这些工具构建者买单。一篇很好的文章显示了 GPU 的资本投资。作为一个群体,我们需要创造一些应用,来填补这数百亿美元的空白,这是我们现在已经进行的资本投资,特别是在 GPU 方面。

所以,我不知道媒体会做什么,他们有自己的炒作周期。但我认为大量的实际工作,不仅仅存在于基础模型那里,而是在医疗保健、金融服务、教育、电子商务等所有这些领域,去识别和执行项目。