AI发展何去何从?李开复:中美大模型只能存活五六家

转载
330 天前
3236
新火种

文章转载来源:新火种

作者:小岩

编辑:小迪

来源:新火种

如果把时间回拨5年,我们会发现,全世界范围内能够进行AI大模型研发的团体,屈指可数。要知道,能够训练大模型的算力设备基本是近3年发布的,而现象级产品ChatGPT的诞生,不过是最近一年的事情。

毕竟,大模型的发展需要极高的门槛,不仅需要强大的算力资源,更需要丰富的数据资源给予支持。大模型时代,离不开大算力,也离不开大数据。

但也就在一年的时间,各式各样,专供大模型的公司和机构如雨后春笋般冒出头。大家开始角力,继而陷入白热化的竞争状态。就连著名AI科学家李开复都表示,未来中美的大模型公司中,能存活下去的只有5、6家。

我们不禁感叹,大模型赛道从“高处不胜寒”到挤兑严重,竟然只需要如此短的时间。

“除了大厂,中美加起来应该可以支撑5、 6家左右”。

12月14日,在一场与AI相关的对话中,零一万物的CEO李开复被问到了一个问题:大模型赛道最终能有几家活下来?对此,李开复也算是知无不言,他认为,除了大厂,中美加起来应该可以支撑五六家左右。

李开复表示,如今来看,做巨大预训练模型的机会正在变少。这个通道不能说是完全关闭了,但势必会越来越难。未来只有在需要新技术的时候,才会出现更多的机会。与此同时,李开复还给出了AI未来的发展方向:AI Infra(人工智能基础框架技术)和AI应用等方面

李开复解释,“做AI应用的机会就是现在,正如10多年前移动互联网所面临的时代一样。较早抓到机会的微信就成功了。当然,后续也有抖音,拼多多等陆续崛起。但一定是越早入局,机会越大。真正有梦想有野心的开发者,应该是要做AI-First(AI优先) ,AI-Native(AI原生)的应用,这些应用才可能成为AI 2.0时代最伟大或是最赚钱的应用”。

事实的确如此。专业性大模型AI的开发竞争激烈,各大公司在训练自家大模型时,还不得不面临巨大的挑战和限制。一方面,大模型的训练需要庞大的计算资源和时间,如果不是大厂或者拥有雄厚的资本支持独角兽,这势必会成为一个难以逾越的壁垒。另一方面,大模型的训练数据需要大量的人工标注和清洗,这个过程专业性极高,复杂而耗时。更重要的是,大模型的应用面临着数据隐私和安全方面的挑战,“如何保护用户数据和防止滥用”是每个大模型开发者都需要考虑清楚,亟待解决的问题。稍有不慎,就会陷入泥潭。

李开复领衔零一万物,发布首款开源中英双语大模型“Yi”。

虽然强调AI大模型即将发展成“红海赛道”,但李开复本人却是赛道里卷的最凶的那个。

作为创新工场的董事长兼CEO,他成立了自己的AI公司“零一万物”。就在上个月,零一万物发布了首款开源中英双语大模型“Yi”。

此次开源发布的Yi系列模型,包含34B和6B两个版本,11月2日,零一万物在Hugging Face上传了这两个参数。据悉,Hugging Face是全球最受欢迎的大模型,数据集开源社区,被认为是大模型领域的GitHub,在大模型英文能力测试中具有相当权威性。

根据Hugging Face英文开源社区平台和C-Eval中文评测所提供的最新榜单,Yi-34B分别在预训练大语言模型和中文大模型榜单C-Eval排行榜爬升到第1位。这也是迄今为止唯一成功登顶 Hugging Face全球开源模型排行榜的国产模型。

与此同时,零一万物新一轮的融资十分顺利,由阿里云领投。目前,零一万物估值已超10亿美元,跻身独角兽行列。李开复在2023年3月创建了零一万物团队,6月开始运营。也就是说,在短短8个月的时间里,零一万物不仅推出了核心产品,更跻身成为估值超10亿美元的“独角兽”。

行业内尽是大厂和“独角兽”,也难怪李开复要感叹大模型赛道竞争激烈了。

大模型Yi全球领跑,旨在打造打造更多的To C Super App。

据了解,Yi-6B和Yi-3B分别代表数据参数量为60亿和340亿,按照李开复的说法,“34B是一个黄金尺寸”。

34B的最大优势在于一方面它不会小到没有涌现或者涌现不够,甚至已经完全达到了涌现的门槛;另一方面,它又没有太大,允许高效率的单卡推理。Yi-34B模型在多项评测基准中全球领跑,基于超强Infra下模型训练成本实测下降40%,模拟千亿规模训练成本则可以下降多达50%。

所谓AI Infra,全称为AI Infrastructure ,即人工智能基础架构技术,主要涵盖大模型训练和部署提供各种底层技术设施,包括处理器,操作系统,存储系统,网络基础设施,云计算平台等,是模型训练背后极其关键的“保障技术”。

AI Infra是大模型行业发展至今较少被关注到的硬技术领域,但也是十分关键的领域。用李开复的话说,“做过大模型Infra的人比做算法的人才更稀缺”。

对于零一万物而言,因为有了Yi做基础,更多To C端的超级应用才有可能出现。Yi的定位是通用底座,已在 Hugging Face,ModelScope,GitHub 3大全球开源社区平台正式上线。与此同时,Yi系列量化版本,对话模型,数学模型,代码模型,多模态模型等都将很快亮相。

按照李开复的逻辑,AI的技术壁垒终将会被一个个的攻破,对于AI公司来说,可持续,可增长的盈利才是要紧事,无法商业化的公司终将被淘汰。在AI 2.0时代,最大的商机一定是来自超级应用,而且是消费者级别的,诸如抖音,微信一样的超级应用。

目前,零一万物已经启动100B以上参数规模的模型训练,而多模态大模型团队也已经集结了10多个人,说明零一万物将朝着“消费级应用”的方向努力。而这些,恰恰与李开复所说的“AI Infra和AI应用才是未来”的理念,不谋而合。