AIPC就是一个超级AIAgent

转载
370 天前
2540
硅星人

文章转载来源:硅星人

作者:王兆洋

来源:硅星人

图片来源:由无界 AI生成

也许我们都把AIPC想错了。

AIPC,AI, PC,这个名字看起来就是AI与PC的一个粗暴组合。最常见的理解是,它是大模型塞进电脑的产物。模型为此需要缩小规模,而隐私则因此受到保护。

它由联想等头部玩家在2023年提出,并且在2024年的CES上已经有相应的即将量产发售的新品展示给人们。这速度反映出当今PC产业链可怕的超高效率,但同时也多少透露着这个行业整个链条里各环节的焦虑——PC出货量的下降,大模型规模越大能力越强的共识,此轮AI热潮里模型与云端互相成就的关系,以及人们对AI新硬件的热切期待,都在加深这个印象。

但这一切其实都建立在这样一个今天似乎已经成型的“共识”之上:我们已经进入一个由大模型支配和决定一切的时代,模型将决定所有软件与交互的未来。模型在吞噬世界,一切不以模型为出发点的人工智能都只是应激反应。

但是,这样的共识真的就是未来的方向么?

一些在努力把模型能力发挥出来的一线项目正在呈现另一个图景。比如最早一批做Agent尝试的AutoAgent等,早期聚焦于围绕模型开发一切功能,但问题却越来越多,之后它开始增加使用工具等能力,才真正开始体现出智能体的样子。比如苹果等硬件公司的研究重点,开始放到硬件和计算机架构层面,去让模型融入硬件,存储,操作系统等已有的特性中去。比如人们又重新开始关注RNN对模型复杂度的帮助,RAG这样类似利用“过时了”的搜索技术的“外挂”设计思路开始走红……它们本质都是对“上一代”技术的利用,对模型的“共识”也开始松动。

这些都指向另一种路线:模型不是一切,模型是“组成”智能的一个重要部分,但它非常需要其他技术,而不是要替代一切技术。模型不等于智能,Agent不是模型的一个分支应用,而是包含了模型的新的智能系统。

这是两种对于AI未来的判断。现在都还没有达到这两种理想状态的产品出现,但今天如何思考这个问题,依然会决定一家公司和它的产品面向未来改造自己的路径。

我认为对AIPC的理解更应该从第二种路线出发,它潜力巨大。在CES上我带着这个思考有机会跟联想的高层作了交流。这个PC出货量第一的公司也在尝试定义着下个时代的AIPC究竟是什么。

“我们不是短期追逐AI,这早已是我们的长期战略。”联想集团董事长兼CEO杨元庆在2024年的CES期间对我们说。做为AIPC概念最早的提出者,联想在这次的大会上发布了10余款AIPC雏形产品,包括提供AI创作工具Yoga Creator Zone的Yoga Pro 9i,无缝切换笔记本电脑和平板电脑模式的ThinkBook Plus Gen 5 Hybrid、商务AI PC ThinkPad X1 Carbon AI、新一代超小型ThinkCentre neo Ultra等。另外联想还计划之后在中国的一些产品里推出AI now的大模型助理软件。

联想称这些产品目前是“AI ready”阶段。从这些发布中可以看出,这个阶段联想其实做了几件事:基于对硬件的理解来系统优化模型,设计出AI与软件以及用户交互的雏形,以及布置有更多可能性的接口。

“现在这个产品只能叫AI-ready的产品,主要是利用显卡,不管是集成显卡还是独立显卡来加强它的计算能力。现在看到的 PC大概只能做到10个Tops的算力,我们觉得理想的情况是要到40个Tops,才可以算是AIPC第一代,它要到今年下半年这个才能够正式推出。”杨元庆说。

杨元庆把AIPC理想中的样子用五个特点总结:首先它要有大模型,是一个大模型驱动的AI,第二它是有一个很强大高效的异构算力软硬件平台支撑。第三它有自我更新和与时俱进的能力,可能会通过强大的存储来实现;第四是有一个更像人与人交互方式的自然交互能力;第五是有很强隐私保护能力。

“今天我们要走向智能体,有三个能力要进步,一是有与外界交互和感知的能力,二要慢慢具备去理解和调用工具的能力,第三要有长期、短期记忆去做规划。”联想集团高级副总裁、首席技术官芮勇博士说。

这是很有意思的判断。因为当你去对应着计算机架构去思考这三个因素,会发现一个有意思的事情:PC具备所有“基础”——作为一个完善的硬件,它的摄像头传感器等以及可以继续拓展的插件,可以更好感知物理世界;与其他智能体相比,它的环境天然存在各种工具——那些丰富的应用,尤其是生产力工具应用就是一个Agent的现成的工具箱;而计算机体系架构里的存储器已经在频繁称为大模型长短记忆设计的参照。

所以,现在再来理解AIPC是什么?

AIPC是一个更强大的AI Agent,而这个Agent也不是此前在OpenAI引导下很多人所理解的“模型的应用形态”,而是一个超越模型之上的下一个AI形态,一个更接近AGI的形态。

“我理解世界模型所说的五层,第四层是单Agent,第五层可能就是多Agent,人类就是多Agent,而到时候可能就实现AGI了。”当我把这个观点讲给芮勇,他对我说。

实现这个超级Agent的过程中,各个参与者现在在做的也不再是削足适履,而是发挥它们最懂的系统和软硬件优化技术,利用一切已经存在的技术方案和架构,以及未来还会出现的新技术,来为这个Agent的发展补上剩下的几环。

据芮勇透露,联想在KV Cache上做了很多优化,借此去通过硬件和系统层面的优化来增强端侧模型的上下文记忆能力,从而避免用算法的方法增加上下文长度时会出现的空间占用过多的问题。此外,作为一个需要在离线时使用的模型,它也必须是个多模态能力的模型。

“能做成这件事,第一要对计算机体系架构非常了解,他要了解有的时候瓶颈不在于计算,是在于内存带宽等,第二,他要对GPT 这个模式的算法非常了解,比如它其实是一个个token往外吐,吐出来的再加到输入,所以输入越来越长,但它在算的时候绝大多数是乘法和加法,所以足够聪明的人就能意识到其中很多是前者已经算过的,进而找办法判断算过的值哪些大概率会继续复用,哪些不太会。”

而PC厂商的研究人员过去在做的事情就是对软硬件、对算法做优化,并形成产品方案,在这次发布的产品背后联想自己的LA系列AI芯片也在模型训练和推理中应用到了CPU资源、存储资源和效果的优化中。

“这些方面都是要下很大的功夫,少了任何一点都不行。”杨元庆说。

一个体系完善的AIPC比单枪匹马的大模型更接近智能体形态,而PC厂商们离AIPC更近,属于他们的大机会来了。