AIIinAI的王小川,喜提顶配的“ATM”

转载
431 天前
8440
AI黑马

文章转载来源:AI黑马

原文来源:AI黑马

图片来源:由无界 AI生成

AII in AI 的王小川,喜提顶配的“ATM”。

近日,百川智能官宣已完成A1轮战略融资,融资金额3亿美元,阿里、腾讯、小米等科技巨头及多家顶级投资机构均参投了本轮融资。

加上天使轮的5000万美元,百川智能的融资金额已达3.5亿美元。

目前腾讯、阿里、小米、金山、慕华资本、清华控股、好未来、渶策资本、深创投、红点中国、卓源资本、众为资本、愉悦资本、顺为资本、心资本等十余家头部机构均已投资百川智能。


 王小川的AI哲学 


不久前,王小川还发表了《展望AI大模型时代》的主题演讲。内容很前沿也很精彩,透露出王小川的AI哲学,分享给大家:

第一个问题,在今年年初时候已经争论的吵翻天了,AIGC时代是否已经到来?

现在已经基本有一个统一的想法。第一一定是了不起的新的技术上的大突破,同时今年4月份的时候,微软的一个大概400页的报告也提到今天ChatGPT-4已经具有初级通用的人工智能,因此认为这个新的时代已经到来了。

在行业当中马化腾也用到了这个话,讲到以前他认为这是一个十年不遇的机会,现在是百年不遇的新的起点。

什么叫百年?几百年,那就甚至快到工业革命之前,所以今天这个时代的变迁是能够超越工业革命、电器革命、包括信息革命的总合。

我个人是抱有这样一种信仰,我们已经走出了信息文明的时代,开始面向通用人工智能时代。

今天ChatGPT,大家每天都惊呼它很了不起,但离它终极,我们这个时代所带来的AGI技术,能够最终呈现的创造力还有很大的想象和突破的空间。

第二个问题,今年年初大家多多少少听到两个行业顶尖人,对大模型有不同的理解。

我从这里引申一下,大模型是什么?可能很多朋友也参与其中,已经用到了创造大模型,也有一些人还没接触到。        

今年两个很有意思的说法:‍‍‍

一个是比尔盖茨讲到大模型像移动电话互联网一样,具有革命性影响,把它比作互联网和移动电话。

但黄仁勋提到一个新的观点iPhone时刻。

我们可以看到很大区别,比尔盖茨讲的是基础设施这种建设,把它当成互联网,而在黄仁勋讲的是iPhone,讲的是什么意思呢?

我理解的时候,翻了一下他们详细的更多阐述,比尔盖茨说法来讲,机器今天变成一个可以读、可以写、可以理解语言的机器人,读Read、写White、理解understand,所以它其实从能力层面来剖析大模型。

而黄仁勋,英伟达的创始人讲到它是和人类的关系,大模型带来一种人机交互,人和整个科技交互新的范式,iPhone使得我们接触这样的信息变得足够简单,而大模型时代,我们用语言能够开始和机器打交道,并且机器背后带有我们思考的能力。

所以我们今天做大模型能够对比新时代,两个典型,同时扮演两个角色,我们在新时代时候看到两个重要的技术发明,叫底层系统芯片。

从CPU到GPU,今天所有的电器设备里面,都装有芯片,能驱动这样一个信息文明的发展。

而上者的初期,其实第一个大的突破,是搜索引擎,今天是每个人都在用的这样一个软件。

到后来推荐引擎,等等有新的发明,他初期搜索时代,我们叫人人都接触信息,更加平等化,都变得更可达,这是之前的新时代结构。

我们现在打个比方过来,现在大模型同时存在两个事情,底层模型叫语言模型,称为Large Language Model,又称Foundition Model,这个Model可以类比成有芯片,有闭源的,有开源的,有几十亿参数,上百亿参数,上千亿参数。在这样一种体系里面,更多像芯片一样,有大的、小的通用的垂直的这是很相似的一个结构。

同时依托大模型,OpenAI这个破天荒的,首先发了一个产品,叫ChatGPT,它是直接能给消费者去使用的人机交互界面,像搜索一样。

今天我们提到大模型,大家可以想芯片,提到ChatGPT,大家想到搜索,这是我们认为既是底层生产力,又是同时上层人机交互的一个界面。

还有大家问的一个问题,相对深奥一点,是我特别愿意跟大家分享的。为什么AGI的起点是语言模型?

我们在上个时代的时候,大家用图像很多,人脸识别图做得很多,这个时代图片也有很多发展,大家最关心的是在语言。

所以这块我想引用维特根斯坦的一句话,叫语言的边界就是视觉的边际。

不管是马克思也好,图灵测试也好,其实都对语言情有独钟,语言的对话表示是否是一个智能。

甚至用马克思一句话,会使用语言是人和动物的一个根本区别。

我们知道一个猫狗图象识别能力很强,甚至能够自动驾驶,不像今天开个车还开不动,但是如果一个猫狗能够说话一定会吓死你的,当它有了语言以后,就带来了对这个世界认知的一种范式变化,不只找后面一种含义。

如果我们再假想一个在原始部落,这部落如果只懂800个单词,一定文明挺落后的。

我们每对世界多一份认知,多一份词汇的构造,甚至多一份表达我们对语言的理解,语言代表认知,因此我们有提到,语言是知识、思考、沟通和文化的载体。

当今天机器掌握语言之后,就同时掌握了思考、沟通、知识和文化,这是特别大的一种突破,语言和原来的图像语音来讲,它带有一个人类传承文明的最重要的认知和理解。

下面再讲,我们在科学发展里面,有哪些已经突破,有哪些技术还没突破到的。

打比方讲,我们今天把语言变成了数学模型,掌握了语言,现在通过大模型本身,是把优质语料,把它压缩成小模型,能够在中间掌握语言,语法词汇的规则,是用一个模型掌握语言。

在几百年前的进展,实际上是用数学模型表达了这个物理世界,像牛顿做的工作,是把物理变成数学,这是康德讲的,像牛顿三大定律、万有引力公式等等。

我们看到纷繁复杂的世界变化,星球是怎么运动的,苹果怎么落地的,最后变成数学公式。

能把一个表象变成一个数学模型,这是人类认识世界的一个重大突破。

因此,我把今天语言能够做大模型,类比在牛顿当年开创了,把物理变成数学这么重大的一个变化,那它这就做到头了吗?

其实也没有,我们对生命怎么变成数学模型现在还没有做到。

刚才蔡毅教授提到,在2021年AlphaFold的开源发布,代表从基因到蛋白质这这三段结构,这么一段东西变成了数学模型,但是这还远远不能理解生命。

因为我们知道,人其实不只一个基因,人有两万三千个基因,它们之间只是构成我们DNA的5%,下面这个生命还有巨复杂的底层逻辑,是没弄明白的。

从基因到蛋白,拼成人体的组织,成为一个功能的时候,也很复杂,因此今天即便我们弄明白物理的数学模型,弄明白语言所带来的数学模型,我们理解这个世界还是有蛮远的距离。

第四个问题,AGI的世界会变得怎样?

这是很多人在问的问题,跟我们什么样关系。简单来讲,行业和我个人的思考。

在行业中已经有一定有共识,有两个词,一个是生产力提升。

大家都会看,每一次技术革命都是生产力的一次爆发。         

这次和以前相对区别而言,会诞生一个新的物种,我们称为智能助理,从ChatGPT的源头开始,它形成一个和人能够沟通、有常识,能开始帮你解决问题的一种机器,甚至它自己还会调用工具。

一个会语言,会调用工具的,它已经不是简单的自己是个工具了,其实类似于我们叫智能体,在向外发展的时候,它是类人的一种方式。

以后会有你的私人老师、私人医生,私人伴侣都可能。因此在助理这方面,会像人一样会诞生。

还有在ToB行业生产领域,开始叫做你的数字员工。跟老板讲,提供大模型能干嘛,很多人不太理解,提到可以做数字员工,它对降本增效,对创造力就更多的理解。

再预测一下,在未来除了这两个领域之外,既然大模型不只是能够像人一样跟你对话。更多它是对世界有认知之后,能够创造开始有新的虚拟世界。

我们借用游戏里面有一个词,叫开放世界,有点类似原来元宇宙一样的,通过今天的大模型开始能够创造一个他所定义的接近现实规则,又能在虚幻空间存在的一种新的虚拟世界,在娱乐、游戏里面会有很大的意义。

第五个问题,ChatGPT会取代什么样的职业和工作?‍‍‍

这是很多朋友问到我的一个重要的问题,尤其是今年年初大家很恐慌。

回答这个问题,我可以延用山姆·阿尔特曼讲的一句话,他是OpenAI的创始人,他讲了,意思是人工智能将导致人在电脑面前的工作的价格下降的速度,远快于现实中发生工作的价格。

什么意思呢?电脑面前的这种工作效率会成百倍提升,但不是人本身提升的,而是人和机器结合会提升很多。倒过来,人在电脑面前的价值相对会下降。

我们今天看到,大模型做的很多工作,取代了很多,像平面设计,做一些简单的美术工作,写诗、画画、写作,都是电脑面前的工作被它升级甚至取代了。

这里会跟大家提到一个比较有信心的想法,就是离电脑越近,你工作如果天天在电脑面前,就有更大被取代的可能性。

也有朋友提到,那小朋友怎么教育,我同样提到,不要天天泡在电脑面前,更多到真实世界当中去,跟他的小朋友去互动,从读万卷书走向行万里路,去获得更多的经验,这是今天大模型所不能承载的一个事情。

后面还有更多的思考和实践,是我们行业在推动的。

今年在6月份百川发布了第一款模型,6月15日之后,我去了一趟美国,走访了大模型所有主流公司,从OpenAI到微软、谷歌等等,非常大的感叹。

我去之前理念上我们是比他们慢半步的,我们要抓我们的落地,从走访了十多个公司,30多个人之后,我提了一个新的理念,叫在理想上慢一步,在落地上快三步,确实我们知道OpenAI这个公司代表了一种不惜成本的耕耘计划,在构建一个更加超前的AGI模型。

在今天中国现在而言,我觉得我们需要有一种不同的竞争策略,今天我们在芯片有受到限制,我们投入的资金也不能像OpenAI这么大,它在美国融了100万美金,往下继续在中东融1000亿美金,因此我们在追赶的同时要认清现实,我跟他们同事在聊的时候,他们说他们正在尝试设计把1000万个GPU连在一起做一台超级的面向AGI的计算机。

怎么叫1000万颗呢?英伟达一年生产GPU是一百万颗,它要设计1000万颗的集群。在国内从百川能够拿到1万颗GPU就已经是很了不起的事情,因此我们和他们的距离可以看到是非常大的。

幸运的地方是我们并没有掉队,年初大家很恐慌,美国的技术已经发展到无穷远了,我们根本不知道怎么做。

现在想在国内大家至少做到3.5水平的AGI的初步能力,在今年年底大概是能到来的,包括百川好几个公司能够做到。到它4.0往下到5.0的东西,我们可能有巨大的距离。

所以我们相对他们而言,确实在登月上我们是落后了,但是我们至少没有被完全甩开,更多把精力我们除了追赶以外,需要在落地要更快,在技术层面能够把搜索增强,强化学习,垂域这方面,包括把应用做好,而不是一味恐慌或者惊叹怎么追赶美国,我们有机会在应用上是能跑在他们前面去的。


百川智能的AI步伐 


公开资料显示,百川智能成立于2023年4月10日,由前搜狗公司CEO王小川创立。其核心团队由来自搜狗、Google、腾讯、百度、华为、微软、字节等科技公司的AI顶尖人才组成。

目前,百川智能的团队规模170余人,其中硕士及硕士以上学历员工占比近70%,研发人员占比超80%。

在人才和资本的支持下,百川智能保持了惊人的大模型研发速度。

成立仅半年,百川智能便接连发布Baichuan-7B/13B,Baichuan2-7B/13B四款开源可免费商用大模型及Baichuan-53B、Baichuan2-53B两款闭源大模型,平均每28天就会发布一款新的大模型。

Baichuan-7B/13B两款开源大模型在多个权威评测榜单均名列前茅,累积下载量超过六百万次。

Baichuan2-13B在MMLU、CMMLU、MedQA、USMLE等几大权威评估基准中,以绝对优势全方位领先LLaMA2,引领开源社区走向中文开源大模型时代。

8月31日百川智能率先通过国家《生成式人工智能服务管理暂行办法》备案,是首批八家公司中唯一一家今年成立的大模型初创公司,并于9月25日开放Baichuan2-53B API接口,正式进军To B领域,开启商业化进程。