崛起的「清华系」,被改变的中国大模型格局

转载
461 天前
8563
AI之势

文章转载来源:AI之势

作者丨山核桃

美编丨渔   夫

来源:硅基研究室

编者按:

一面狂热,一面冷峻,这是中国大模型行业此刻的现状,「混沌年代」可能是这一行业最贴切的标签。大模型狂飙这半年,技术与人、技术与产业、人类文明与技术文明,走向了一个新的重构阶段。这种变革背后,既是技术的进步,也是关键人物与关键企业的推动。

作为智能时代的前沿观察者,「硅基研究室」关注一切与技术相关的故事,今天,我们将启动「大模型的混沌年代」这一策划,从解构大模型开始,将镜头转向这些浪潮前沿的公司与人,分享与解读他们的独特洞察,以飨读者。

此篇为该系列策划的第三篇稿件:《崛起的「清华系」,被改变的中国大模型格局》

第一篇:大模型的混沌年代:矛盾、分化与未来

第二篇:大模型的应用热:最甜的蛋糕与最难的关

如果要给中国大模型的创业图谱寻找一个坐标系,清华大学东门外的几栋楼或许是最好的选择。

几个十字路口,隔着几层楼,矗立着的楼宇里聚集着中国大模型行业的先行者。最瞩目的要数搜狐网络大厦,它位于园区的东南角,二层是王小川的百川智能,七层到十一层是来自清华知识工程研究室(KEG)的智谱AI。距离这里不远的地方,是聆心智能、深言科技与澜舟科技等明星创业公司。

尽管创业的时间与契机并不相同,但它们都共享着一个身份——清华系。

在中国人工智能技术的发展史上,“清华系”注定是一个无法绕开的节点。这里是中国人工智能教育的原点之一,六十多年前,当一辆接新生的大卡车在夜色中径直开到宿舍门口,彼时还未与人工智能结缘的张钹院士还在心中感叹「清华园真大」,距离清华计算机系正式成立「人工智能与智能控制」教研组也有数年。

而如今,在大模型掀起的新一轮AI浪潮下,「清华系」的创业者已成为了其间不可或缺的关键力量。为什么是清华?清华系崛起背后,又有何深意?


01大模型浪潮里,“清华群星”闪耀时


任何创业圈都习惯为创业者贴上标签,「标签」既可以让资本快速筛选优质标的,同样也是初创企业最好的简历,而对技术密集型的企业而言,「学历」无疑也是最好的标尺之一。

翻开此轮的大模型创业名单,无论是已有所成就的创业大佬,还是眼下的创业新手,“清华群星”几乎占据了大壁江山。

曾经的「互联网四杰」,搜狗创始人王小川,在尚未创业时,媒体给他贴上的标签是「清华天才少年」。这位被点招进入当时清华大学计算机系的学霸,几乎每年还会参加清华计算机系的学生节。现在,45岁的王小川有了一个新身份——大模型创企「百川智能」的创始人。

淡出创业圈多年后,这位曾经的创业大佬选择投身大模型,认为做大模型是一件特别适合自己的事。“大家没人说过「小川适合做搜索」,但都说「百川适合做大模型」,对我来讲,是一件非常幸运的事。”

而比王小川更早些选择投身创业的,还有衔远科技创始人周伯文,他是清华大学电子工程系的长聘教授。另一家被腾讯、米哈游、高瓴等明星机构押注的MiniMax,其创始人为前商汤科技副总裁闫俊杰,闫本人也曾在清华大学计算机系从事博士后研究。

如王小川一样的创业者往往参与或经历过大公司前沿技术的探索过程,他们的创业既是为了个人理想,也先天自带商业化优势,信奉的是「大力出奇迹」。从百川智能先后推出开源和闭源的模型产品中就能看出,「借助先发优势,抢占身位」是他们从上一轮技术浪潮中学到的竞争法则。

另一派同属清华系的创业者,无论从公司架构还是发展历史,其气质也更为「学术正统」。

由清华计算机系李涓子和唐杰教授担任首席科学家的智谱AI,其孵化于清华的知识工程研究室(KEG)。该实验室成立于上世纪九十年代,一开始走的就是「科研+工程化落地」的路线,而唐杰教授的得意门生杨植麟则在今年创立了月之暗面,其技术背景备受投资人青睐。

深言科技和面壁智能则脱胎于清华自然语言处理与社会人文计算实验室(THUNLP)。THUNLP创立于上世纪七十年代,创建者为我国NLP领域的泰斗级人物黄昌宁教授,如今的学术带头人则为其弟子——清华大学计算机科学与技术系教授、清华大学人工智能研究院常务副院长孙茂松。而上述两家创企的创始人均为孙茂松的学生。

隶属于清华计算机系下的交互式人工智能课题组(CoAI),其学术带头人为朱小燕教授和黄民烈副教授。从CoAI里走出的聆心智能,对标的是大洋彼岸外的Character.AI。而由清华计算机系教授朱军带队的新AI公司生数科技也已完成两轮融资,朱军师从清华大学计算机系教授、中科院院士张钹。

学院派创业的特点是,一方面有着极强的技术基因,其产品背后的技术路线并非一日而就,而是代代师承的结果。另一方面,对比此前的AI创业热潮,学者们入局的速度正在加快,产投研一体化的趋势突出。

如深言科技创始人岂凡超的恩师孙茂松担任深言科技首席科学家,岂凡超想和教授交流时,只用走几百米回学校,面壁智能背后也有智谱AI的参股,月之暗面的另一名创始成员也来自清华大学计算机系,和杨植麟师出同门。

另一方面,在此轮大模型创业背后的投资方中,“清华系”的创投者们也颇为瞩目。包括图灵创投、卓源资本、清华控股、水木清华校友种子基金、无限基金SEE Fund等清华系创投机构也频频出手。如图灵创投投了聆心智能、智谱AI,起源于清华大学FIT楼实验室的卓源资本投了生数科技。

技术、人与钱,决定着此轮大模型创业的格局,清华在此轮竞争中似乎有着得天独厚的优势。但另一个问题也随之而来,为什么是清华?


02“清华系”崛起:历史、情怀与机制的胜利


今年6月,53岁的360创始人周鸿祎被清华大学计算机科学与技术系电子信息专业录取,他在自己的微博上晒出一则录取通知书,也引发了人们对清华大学与的人工智能学科建设的好奇。

事实上,在中国人工智能技术的发展史上,“清华”注定是一个无法绕开的节点。此轮大模型热潮中,清华系之所以成为创业主力,背后是历史、情怀与机制的支撑。

首先,离不开的是学科建设历史的沉淀,这也是清华系的底层技术实力。

1978年,为了满足国家发展计算机科技的需要,清华大学自动控制系更名为“计算机技术与应用系”,内部同时成立了“人工智能与智能控制”教研组,正式探索人工智能方向的本科教学,张钹院士回忆起当时的中国人工智能发展用“一穷二白”来形容:“当时国内科研人员对人工智能领域发展的认识很有限,甚至相关资料也非常少。”

在对人工智能领域的初步了解后,学者们确定了几个具体的方向,比如专家系统、自然语言、语音识别和智能控制等。但为了弥补与国外研究的差距,他们一边向外看,去国外进修学习,将国外的先进知识翻译到国内,同时开展前沿科研工作,另一边则不断探索与完善学院内部的培养计划。

彼时,张钹院士作为访问学者前往美国伊利诺伊大学香槟分校进修学习,黄昌宁教授则赶赴耶鲁大学进行为期一年的访问。据张钹院士回忆,他通过将伊利诺伊大学使用的教材和相关材料全部复印并寄回国内,这些远渡重洋的珍贵资料成为了辅助清华大学计算机系教研工作的利器之一。

于此同时,清华大学也开始为本科生开设《人工智能导论》等相关选修课,有效填补了当时国内的课程空白。1983年,清华计算机系又将《人工智能》列为本科必修课程,相关教师也相继编写了人工智能方向的教材,如《人工智能原理》(石纯一,林尧瑞)、《人工智能及其应用》(徐光佑编译)、《人工智能手册》(钟玉琢编译)等。

也是在这一时期,中国学者开始在世界人工智能界崭露头角。张钹院士完成了中国科学家在人工智能领域的第一篇学术论文,并成功发表于人工智能领域顶级国际期刊上,由此开启了人工智能发展的新篇章。

除了本科生教育体系的搭建,从1978年开始,清华开始招收人工智能硕士研究生,1986年,开始招收人工智能方向的博士生。同时通过建设一流的实验室,加强国际合作与交流等举措,清华不断夯实其在人工智能领域的竞争力。

一个最典型的案例就是「姚班」的建立。清华大学利用企业的赞助资金,积极邀请世界著名的教授参与清华的培养工作。在2003年到2006年,图灵奖获得者姚期智作为受聘者,与清华结缘,而后直接回到清华大学担任长聘教授,并创建了「姚班」。

「半数英才聚清华,清华英才在姚班」。如今从姚班已走出的一大批毕业生,也撑起了中国人工智能的半边天。

历史的沉淀外,创业情怀也是清华系的特点之一。在上一轮的互联网创业潮中,清华系创业者身上就展现出了极强的创业意愿以及对事物本质的探索精神,这在美团的王兴、快手的宿华、豆瓣的阿北、搜狗的王小川身上都有明显的体现。

而在此轮的大模型浪潮中,应用场景的选择,商业模式的构建以及技术路线的抉择都需要这种回归本质的精神。换言之,创业者必须要对自身的优势与未来技术的发展作出较为准确的研判。

这之中,相较于智谱AI等较早入局大模型的创企,王小川的百川智能作为「后发者」,就先通过较快的产品迭代,借助过往的做搜索的优势,打出声量,王小川的理解是“先填补国内商业生态的空白”。周伯文的衔远科技则是聚焦大模型对人与产品关系的重塑,聚焦消费品供应链这一垂直场景,这源于他过往在老东家京东的经验。

质疑总萦绕在耳边。比如,外界认为,做通用大模型是大厂的事。再比如,也有投资人对周伯文说:“你把事情做小了。”

但清华系创业者大多关注本质,对于「竞争」想的并不多。王兴曾说过一句话:“太多人关注边界,而不关注核心”。在清华大模型创业者身上,也有类似的创业气质,他们接受竞合是一种常态。

最后,清华系的崛起,也是一种开放机制的胜利。

其中,不得不提及的就是成立于2018年的北京智源人工智能研究院(以下简称:智源)。

这一独立于政府、商业、和高校之外的非营利的新型科研机构,被称为大模型行业的「黄埔军校」。微软总裁布拉德・史密斯此前曾在一次采访中认为:目前在人工智能领域,世界上三家公司处于绝对前列,一个是与微软合作的Open AI,第二个是谷歌,第三个是北京智源人工智能研究院。

智源既是一个非盈利机构,一个技术社区,同样也是一个理想化的「乌托邦」。2020年,智源开始实践大模型,启动「悟道大模型」项目,不问英雄出处。根据「雷锋网」的报道,包括清华、人大、北大、中科院等高校的学者与老师,一些外部成员也参与了进来,组团攻克中国大模型的难关。这个项目里集合了如今我们所知道的诸多清华系的大模型创业者:唐杰、刘知远、黄民烈、杨植麟......

可以这么说,立于大模型浪尖的清华,其崛起既是前人探索的沉淀,同样也是当代「产学研」创新机制下的结果。


03大模型的竞争,归根到底是「人」的竞争


清华系崛起,五道口造梦。一切商业竞争,回归本质依旧还是关于「人」的竞争。

大洋彼岸外,表面正酣的大模型热潮,谷歌和OpenAI的人才战争则是水面下的暗线。据媒体报道,在过去的五年里,超过30位高管、工程师或其他员工离开了OpenAI选择创业,据「量子位」统计,OpenAI的51位研究人员中,有16位人才离开了OpenAI,离职率高达三分之一。这群OpenAI的叛逃者被称为“OpenAI黑手党”。

而他们所构建的人脉网与资本网,将聪明的人与聪明的钱串联在了一起,这种独特的「叛徒文化」既带来了一个各司其职、分工明确的创新生态,也铸就了多元与丰富的「独角兽土壤」。

当然,中美国情的差异化,OpenAI的故事注定无法复现,可能的原因有三:

一是,时间的差异,区别于美国应用层的繁荣,中国大模型底层格局依旧未定,因此应用层发展仍在初期。

二是,路线的分化。美国大模型注重底层技术的研发与创新,例如在硬件和深度学习框架上都处于世界领先地位。而中国更聚焦在应用层,强调融入产业,以及商业的变现。

三是,塔尖人才分布的差异。根据未尽研究的统计,在全球范围内入选人工智能学科AI2000名单的顶尖学者中,美国多是来自于科技企业。例如,谷歌、微软、Meta合计招揽了三成的美国顶级学者。而中国的人工智能顶尖研究人员,压倒性地来自高校,阿里巴巴则是中国招揽了最多顶级学者的企业。

「清华系崛起」背后,释放出了一个新信号:从研究到创新,从象牙塔到企业,更多的顶尖人才正借助商业力量推动技术创新实现具体应用场景的落地。更多的青年科学家也正在以自己的方式,带来新的创新。

区别于上一轮的互联网创业潮,此轮的大模型热潮似乎已不是一个「以输赢论英雄」的年代。清华大模型的创业图谱已然说明了一切,它包容多元,欢迎创新,也乐于共享,甚至超出了单纯的竞争思维。

但挑战依旧摆在眼前。如何提升创新效率,建立更健康的创新生态,这既需要创业者对自身有着更精确的定位,对技术有敏锐与理智研判,同样也依赖于政策、资本与学界的合力,探索出一套更先进与高效的合作方式。

参考资料:

1、雷锋网:《五道口简史》

2、张钹院士:《清华办AI,除了洞见,更有沉淀》

3、晚点LatePost:《大模型创业潮:狂飙180天》

4、科学中国人:《张钹:人工智能,从过去到未来》

5、创头条:《AI江湖里的“清华帮”》

6、投资界:《最近,清华系创始人太火了》

7、中国企业家杂志:《中国的OpenAI,藏在这几栋楼里》

8、清华小五爷园:《马少平 周枫 王小川 楼天城 唐文斌:清华计算机系与人工智能40年》

9、雷锋网:《之江实验室陈红阳:大模型要落到实处,必须要解决背后的算力缺口》

10、经济观察报:《周伯文:未知与先觉丨AI·20人系列报道》