人工智能革命2023:无尽前沿

转载
577 天前
4216
AI之势

文章转载来源:AI之势

来源:经济观察网

记者 陈白 高若瀛 郑淯心

导读

壹  ||  对于投资机构来说,新的窗口期已经打开了。

贰  ||  很多人把ChatGPT以及由此衍生的大模型视为这一轮人工智能革命的浪潮之巅。

叁  ||  当参数大到一定量级,AI能 “涌现”出强大的能力表现,具备人类“无中生有”的原创能力。

肆  ||  如果到今年7-8月,市场上还没有人能做出更具想象力的应用级产品,这波由ChatGPT引发的应用创业热潮很有可能会进行一次深刻“反省”。

这一次,所有人似乎都回到了热血沸腾的青春年代。即使3个月前,席卷全球科技大厂的关键词还是裁员、降本增效。但2023开年以来,仿佛一夜之间一切都变了——哪怕是为金融界所忧虑的硅谷银行爆雷,其冲击波的涟漪也很快散去。创业公司们并不会过多提及这一变化,对他们来说,当下有更重要的事情。

九合创投创始人王啸说,“今年初创企业的数量大幅增加。年后到现在,我们AI赛道的每个投资人,平均每个星期都要看十几家,做什么的都有:既有大模型,也有AI心理咨询、AI文秘助手等应用层项目。”

但是,对于人工智能的新一轮竞速,“GPT-4发布之后,大语言模型的第一场仗基本结束,同时开启了AI2.0时代。”4月19日,创新工场执行董事、创新工场前沿科技基金总经理任博冰说。

不久之前,创新工场董事长兼CEO李开复博士宣布筹办一家AI2.0公司,致力打造全新的平台和生产力应用。当然,不只是这位享誉世界的AI专家,王慧文、王小川等等一批我们所熟悉的创业先锋都在归来。

如今,再没有比投身AIGC赛道更为重要的事情。区别于传统的PGC与UGC,AIGC(生成式AI,AI generated content)指通过人工智能技术生产内容——不只限于生成文字、图片,还包括音频、视频,写代码编程也涵盖其中。今天听到的 ChatGPT、Midjourney、文心一言、通义千问等大模型,严格意义上讲都属于AIGC的子集。

在中国,随着百度、阿里巴巴、华为等科技厂商纷纷发布自己的大模型。沉寂三年的科技公司发布会现场挤满了人。这些会议主办方共同的感受是:来的人严重超出预期,哪怕是已经能够容纳数千人的会议,依然有难以计算的人站在过道上。

“最近我们看到开始有非常多的人出来创业,他们来自科研院所、大厂等等背景。”任博冰说,这一领域创业公司的出现速度和他们所聚焦的领域,几乎每个星期出现的创业公司,都有很大的变化。

星瀚资本创始人杨歌说,他们并未对ChatGPT或AIGC的进展单独开过会,“因为我们现在每时每刻都在讨论这个事情。”

有人把这比作十二年前的“iPhone时刻”。在源码资本合伙人黄云刚看来,这次以GPTs和背后大模型为代表的AI浪潮,不仅从范式上完成了变化,解决了自然语言的问题,也从结果上让人们感受到了大模型的潜力,“ChatGPT、开放插件,以及随后一系列在这基础上的应用和各大厂商发布的大模型,已经显示出明显的颠覆万亿级公司的潜力”。

杨歌甚至更加乐观,“我觉得可能不只是iPhone时刻,而是内燃机时刻。因为这一次带来的变革想象,可能会远大于移动互联对于PC互联网时代的升级。”

“现在的变革是以天计算的。”任博冰说,这样快速进化的结果是,第二场仗马上就要来了,“但问题是,就像当年,包括OpenAI自己都没有想到ChatGPT选择的这条路能够走通一样,现在我们也同样不知道,下一次的战场会发生在哪里”。

奇点:博弈新千亿

对于投资机构来说,新的窗口期已经打开,按照任博冰的看法,“AI2.0时代开启了新一轮的创业投资机会,我们将可能拥有千亿美金级别的平台级公司。”

尹伯昊是YC孵化器中国CEO陆奇看中的创业者。在秋季奇绩创坛路演上,他的项目从5000多份申请中脱颖而出,这是他的第三次创业。尹伯昊对“2022年8月24日”这个日子印象深刻:“我和陆奇之前没有什么交集。但在那天,他看完我们的项目后,当天就决定投我们。”

尹伯昊是猴子无限公司创始人。猴子无限是一家生成式AI赛道的创业公司,专注于模型调优。尹伯昊在2022年下半年开始投身AI创业赛道,“我出来创业没有别的原因,就是我看见,技术的奇点已经出现了。”“猴子无限通过大模型FineTune,将少量的个性化数据,比如我的照片、特定商品的图片,训练到已有的大模型中生成新的大模型,再让个性化大模型帮助创作,实现企业级的设计协作。”尹伯昊说,猴子无限也正在参与海尔的空调设计,“个性化的大模型能够让我们为海尔的空调设计,提供更多方案和灵感支持”。

九合创投王啸也对一个日子印象深刻。今年春节前的腊月二十三——本该放假的那周,九合果断决定投下一家由成都游戏公司AI实验室孵化出的专做游戏AIGC生产力辅助工具的项目。这个项目的产品能力之一就是能替代掉位列“被AI威胁饭碗榜首”的游戏插画师。但插画仅是其提供的比较小的服务,更重头的还是聚焦在3D美术素材的生成及内容安全、AI玩家陪玩等由AI驱动的服务上。

九合过会决定投的时候,国内AI赛道的极热浪潮,还没有因ChatGPT而到来。无论是投资人还是创业者,都还沉浸在“久别三年”的新年团聚之中。很快,这股风起大洋彼岸的技术浪潮就席卷了中国。

尹伯昊说,那时候其实大家都开始意识到技术所带来的巨变,生成式AI最核心的能力,是有机会让机器创作出过去只能由人创作出来的模态,向内引入更多数据训练AI一定会带来颠覆性改变。

但相比ChatGPT的大模型,“VC已经很难对大模型下手。一家VC的管理规模约10亿人民币,现在一家初创模型公司上来就融资5000万美元,一下就盖掉资管规模的1/3;我觉得百分之八九十的VC基本都明确了,这不是我们能玩的事。”一位不愿具名的VC投资人表示。

4月21日的一篇报道也引述芯片行业研究公司Semi Analysis首席分析师迪伦·帕特尔(DylanPatel)的观点:OpenAI每天为运行ChatGPT投入的成本可能高达70万美元。但帕特尔最初的估计是基于GPT-3模型,在采用最新GPT-4模型后,ChatGPT现在的运行成本可能更高。

AI赛道从持续的“寡淡”到2022年底的“出圈”,再到今年的“爆火”,愈发让王啸变得“冷静”起来。如果说ChatGPT成为那个奇点,究竟给投资认知、创业方向、行业格局带来了什么改变?

三年前,时尚电商ZMO创始人张诗莹就开始关注人工智能。她认为,未来AIGC能做到两件事:第一,降低内容生成门槛,以前大家需要学习拍摄,学习Photoshop;未来只需创意就能生成内容。第二,未来的内容不可避免需要人人成为创作者。“可能先从AI辅助人类创作,到后来部分由人创作,部分AIGC创作。当人类对内容的需求呈指数型上升时,供需之间产生差异,我们一定需要像AI这样的工具,辅助人类构建有更多内容含量的世界。”张诗莹说。

在王啸看来,ChatGPT率先完成了行业对AI的认知统一和市场教育:AGI是不是终局已不再是疑问;在此之前,一切都仍是未知,“过去各行各业都讲过AI模型的故事;但现在行业故事基本被替代。AI到底应该用来做什么、怎么做的问题,短时间内更好地回答,就已经变成去做大模型及其上面的应用。”

对于投资机构来说,新的窗口期已经打开了,按照任博冰的看法,“AI2.0时代开启了新一波的投资创业机会,这股浪潮将穿透甚至重塑各行各业,在这个过程中,我们将可能诞生千万美金级别的平台级公司。”

起跑:路线问题

“当时没有人能够预测到GPT这条道路能够跑通。而且大语言模型也绝对不会是终点,它只是其中一个类型。可能OpenAI现在也未必认为下一轮AI就一定要朝着LLM的方向去,多模态的战场里可能有新的对手,比如Tesla。”

很多人把ChatGPT以及由此衍生的大模型视为这一轮人工智能革命的浪潮之巅。任博冰说,“即使没有OpenAI和ChatGPT,也会有另一家公司、另一款产品。因为生成式AI已经走到了从量变到质变的时刻。”

事实上,即使在最近一年,人们对人工智能技术的认知也在经历着快速刷新。GPT-3发布之时,中国市场对其关注度并不高,直到开放ChatGPT这个应用级产品,大家对它的认知才达到了新的高度。

2022年11月的云栖大会上,阿里云在业界首次提出MaaS(model as a service)的概念。阿里云CTO周靖人说,“这也是我们多年在预训练大模型研发的一系列体验。我们认为,今天以模型为中心的开发,模型即服务的开发,已经形成AI开发的一种新范式。随着今天人工智能的快速发展,我们要真正把模型作为重要的生产元素,我们对业务的开发系统要围绕着模型来。这是我们之前提到model as a service的一个重要出发点。”

对于什么是“model as a service”,周靖人进一步解释,“以模型作为一个生产元素不是简单的空话,更重要的是围绕模型的全链路生命周期,要围绕模型本身,从模型的生产到模型的查询,再到模型的使用,都要形成一系列产品。能够帮助开发者,首先是开发模型,同时查询模型,更重要的是使用模型,只有这样才能真正意义上实现model as a service。”

但这一概念的发布在当时并未引起太大关注。“我们内部讨论还觉得奇怪,我们认为是很大的变化,但现场提问时却根本没有人关心这个。”周靖人说。

钉钉总裁叶军也在后来的采访中,再次向我们提及了阿里云团队感受到的这种反差,“这是从效率时代到智能时代的飞跃。去年云栖做的所有工作,对今天来讲具有历史意义,我也参加了那场媒体群访,但没有几个人关心这个问题。”叶军说,但现在大家反应过来了。

这种反差的背后,是不同的技术、商业路线。

当时,OpenAI的选择看起来是边缘且特立独行的。“很少有人会选择大模型这条路,投入很高,而且当时没有人能够预测到这条道路能够跑通。”任博冰说,“可能OpenAI现在也未必认为下一轮AI就一定要朝着LLM的方向去,多模态的战场里可能有新的对手,比如Tesla。”

在ChatGPT出现的时候,即使其模型知识量很大,但整体的质量还是有很大的提升空间。一般认为RLHF(人类反馈强化学习)是ChatGPT成功的关键技术。直到其投入了巨大的资源投入,通过人工标注、反馈提升其质量。

在GPT模型兴起之前,大多数 AI模型主要是针对特定应用场景需求进行训练的小模型。李开复把此前的这个阶段定义为AI1.0时代。“每一个单独领域都需要单独的收集数据、训练模型、标注数据、清洗数据,然后单独训练模型优化任务,这就决定这种模型是不可能跨领域的。比如电商所训练的模型,就无法放到银行去使用。”在宣布投身这一轮AI热潮前,李开复组织了一次分享会。李开复这样解释。

由于存在通用性差、训练数据少、适应范围小的弊端,使得AI1.0时代的很多人工智能公司很快就遭遇到了应用瓶颈。

但是,自GPT-3.5以来,人们开始看到了以往的AI技术天花板,正徐徐打开。作为自然语言处理模型,ChatGPT的出现和经验表现代表了AI2.0时代的现象级应用开始出现。

在OpenAI发布ChatGPT之前两周,任博冰和其所在的创新工场曾经在硅谷与OpenAI的高管有过一次交流,“他们当时就提示我们,他们正在围绕InstructGPT(ChatGPT的姐妹模型)做更多优化。”

随后不久,GPT-3.5的发布,几乎一瞬间点燃了整个赛博世界。ChatGPT推出仅2个月,用户数已经突破了一个亿,当时的电话和手机分别用时75年和16年才在全球积累1亿用户,即使是上一个最快破亿的程序TikTok也要用时9个月。

任博冰说,其实ChatGPT的发布,开启了AI2.0时代,在这之后,我们看到技术的突破速度开始变得越来越快,“可能这个星期和下个星期,技术的方向都会完全不一样了。”

任博冰的判断是,未来AI2.0的第二场仗的概率最大的战场应该是多模态。但他也说,“这是无法预测的。说不定马斯克会引领下一轮浪潮呢?毕竟特斯拉在视觉领域的积累是无人能够与之相提并论的。那下一次浪潮会不会发生在视觉模态?还是三种模态?现在不清楚。”

本轮AGI(通用人工智能)大爆炸的想象力在于,自然语言处理大模型仅仅是众多大模型中的一小部分。而在ChatGPT之外,Stable diffution、Midjourney等文生图应用,同样获得了突破性进展。而目前被寄予厚望的多模态,则是能够实现对文本、图像、视频、音频的理解和生成能力。

浪潮:意料之外的成功

当参数大到一定量级,AI能 “涌现”出强大的能力表现,具备人类“无中生有”的原创能力。

这一轮生成式AI突破的发端,可以追溯到2006年杰弗里·辛顿及他的学生鲁斯兰·萨拉赫丁诺夫正式提出的深度学习概念(Deeping Learning)。2006年也被称为深度学习元年,杰弗里·辛顿也因此被称为深度学习之父。

2009年左右,斯坦福大学由吴恩达带领的一个人工智能团队发现,GPU能够几百倍加速深度学习系统。然后,训练一个四层的神经网络突然变得很快,之前需要花费几周的学习时间,变成了不到一天。GPU生产商英伟达的老总黄仁勋说这是令人高兴的对称:GPU这个用于为游戏玩家构建幻想世界的芯片,也能用于帮助计算机通过深度学习理解真实世界。

回溯上一波人工智能热浪,大致以2017年AlphaGo围棋大战为节点。在中国市场也能够清晰地看到产业上的变化。2017年出炉的《新一代人工智能发展规划》,明确将人工智能发展作为国家战略和重点发展领域,提出包括资金、技术、人才培养等多方面的一系列支持政策。

2018年开始,全自动智能化涌动,应用于智能仓储、智能制造、智能农业、无人驾驶、机器人等领域。那几年,中国市场活跃的除了传统意义上移动互联时代的华为、阿里、百度等巨头,还诞生了被称为“AI四小龙”的商汤科技、旷视科技、依图科技与云从科技。

在此之后,AI赛道再次“隐入尘烟”。四小龙的估值是反映这种预期坠落的最佳窗口:以商汤为例,其上市后股价持续不振。2022年6月30日,商汤科技上市前投资者、基石投资者股权基本解禁,短短一天之内,商汤科技的市值蒸发了超过900亿港元。

不止商汤,从全球市场看,近年来AI公司的估值普遍遭遇了回调。在商汤解禁前,研究机构麦格理发布研报称,全球人工智能公司的市盈率(TTM),已较2021年底的30倍(商汤科技上市时)下跌至当时的约15倍。

而从过去看,包括商汤在内,AI公司已经在不断进行应用场景的探索。2022年8月,商汤就发布了一款下棋机器人,却被市场认为是“伪需求”。

作为人工智能软件市场规模最大的领域,上一轮AI竞速主赛道是计算机视觉领域。但计算机视觉需要通过深度学习训练来提升,而深度学习的基础是对海量样本进行训练,不断迭代优化准确度,因此对样本的依赖性极强。而当跨场景导致训练样本彻底改变,就需要重新训练。

商汤曾称打造了行业内前所未有的通用人工智能基础设施通用平台SenseCore,实现了多功能超高精度AI模型的大规模量产。但平台技术并未真正意义上实现泛化应用,其所做的生意多以项目定制化为主,即因应不同客户去度身定制相应产品,导致成本居高不下。

计算机视觉的局限性还体现在这一技术本身并无商业价值。AI公司需要花费更多时间将自己研发的AI技术落地到客户场景中,才能给客户带来价值。

这就意味着,当AI公司必须进入到一个与产业结合的市场,事实上也进入到一个由原本产业巨头所主导的领域。AI公司在拓客的同时,将面临不断补齐AI能力的竞争对手,且后者在产业链上下游更具优势。很多人工智能技术公司就困在了技术和市场的夹缝里。即使像百度这样的公司,也需要在研发和商业化之间取得某种平衡。

时间倒退回2017年的百度AI开发者大会。彼时任职百度COO的陆奇,一开场就给出了一个价值判断:AI将和前三次工业革命一样,让人类进入全新的时代。百度要ALLINAI的战略目标,震惊当时的业界。这种ALLIN在后来很长一段时间都陷入“僵局”:2018年陆奇离开百度,几乎成为了一种行业的隐喻。

AI的沉寂不只在国内,随后几年,国外明星AI企业Wave Computing遣散员工,申请破产保护。国内AI头部企业地平线,被爆裁员50%。猎豹全球智库2020年的报告显示,AI企业融资数量持续18年连涨后经历断崖式下跌。相较2018年,2019年融资额从1484.5亿元下降到967.27亿元,下降幅度达34.8%,融资数量从737下降至431,下降幅度达四成。

尽管这几年面临掉队BAT的质疑,AI技术的沉淀使得百度能够在2023年率先发布文心一言,看起来终于扳回一局。

4月10日,商汤发布“日日新Sense Nova”大模型体系,一口气展示了多个产品,有类ChatGPT产品“商量”(SenseChat)、与Midjourney画风一致的秒画平台、AI数字人视频生成平台如影,以及琼宇、格物这两个3D内容生成平台。但资本市场并未给出过于乐观的反馈,截至4月17日,商汤股价报2.73港元,相比去年初高位的9.7港元,下跌超过70%。

在投资人的观察中,问题之一在于数据孤岛、清洗数据太贵,没有成为降低成本的有效平台。而ChatGPT出来后最大的贡献,就是解决了孤岛问题:用全世界的数据训练一个巨大模型,这个模型还可以迁移学习转换到每一个应用里去,“做一个AI应用的成本就可能降低95%,这个时候就可以形成一个真的平台生态系统。”

竞速第二场:无尽前沿

如果到今年7-8月,市场上还没有人能做出更具想象力的应用级产品,这波由ChatGPT引发的应用创业热潮很有可能会进行一次深刻“反省”。

此时此刻正在发生着肉眼可见的竞速。类似猴子无限这样的创业公司,只是当下AI竞速洪流中的一角。在这个四月,几乎能想到的公司,都开始投身这个看起来将要“真正改变一切”的赛道。

头部投资人的预判也几乎是一致的。比如杨歌把人工智能的沿革大致分为三阶段:弱人工智能、强人工智能以及超人工智能,“当下我们站在超人工智能的起跑线上”。

民生证券数据统计显示,4月短短半个月时间,已发布近30个大模型,其中包括互联网公司、独角兽乃至科研院所。国内市场开始敏锐捕捉到大模型以及由此衍生的应用场景。

ChatGPT大火之后,北京知行互动科技有限公司创始人、CEO丁瑞彭观察,这一轮创业热潮中可简单分为两种类型:一是做底层大模型,无疑需要天量资金,机会只属于少量“明星”创业团队和大公司。大量机会还是在应用层,即利用头部大模型的开放能力构建各种应用,突围路径是在对用户和客户需求的了解上,利用AI技术解决用户痛点。

张诗莹称,如果只是ChatGPT,它更像一个有趣的玩具,当它融入人们的日常工作时,才会变成刚需,AIGC必然有产业化的应用。

“如果全都是ToC的AI绘画,我们还是需要跟行业做更好的结合,才会是更有黏度和价值的AIGC。”张诗莹称,“只要需要内容的地方都会需要AIGC。内容已经爆炸,而好的内容还是稀缺。未来C端用户和AIGC的关系,既是消费者也是创造者。”

而对于投资人和创业者来说,如果公共大模型已是“触不可及”,那么一些专属大模型以及在大模型能力之上的应用创新,则还存在巨大空间。

创业项目也确实如雨后春笋般在年后涌现。王啸表示:“去年全年活跃的AIGC相关项目不过20个,但今年的数量就大幅提升了,年后到现在,AI赛道的每个投资人,平均每个星期都能看十几家,做什么类型的都有:从大模型到行业应用层再到C端的应用,包括AI谈恋爱、AI心理咨询、AI文秘助手等。”

王啸的言外之意是:如果没有一定的技术门槛和真实的应用需求,可能不太会投。他说自己现在多了点“审视”心态:现在就看大模型公司们能做到什么程度了。他心里是有隐忧的,尽管现在下定论显然为时过早,但如果到今年7-8月,市场上还没有人能做出更具想象力的应用级产品,这波由ChatGPT引发的应用创业热潮,很有可能会进行一次深刻“反省”。

他担忧更长远的逻辑在于,没有好的应用反哺,大模型大概率最终也不会好,“因为大模型通过深度学习训练,逐渐落地到各种垂直行业和场景里,从而作为底层平台接入其他产品并对外开放,解决具体问题。最后是按照调用模型的次数收费,一定要有很火爆的应用去不断贡献收入分成,模型厂商、应用厂商都能盈利,用户得到更好的服务体验,价值链条才成立。”

中科创星创始合伙人米磊,也经历过新一轮人工智能浪潮的周期。2016年,AlphaGo战胜李世石时,米磊就判断光子技术是人工智能的基础设施,能够为人工智能提供核心的数据和算力支撑,所以中科创星前期重点布局了以光芯片为代表的人工智能基础设施技术,同时布局了下一代人工智能算法公司,以智谱华章和瑞莱智慧为代表的算法公司。

但此轮人工智能赛道热了之后,米磊出手的节奏、看的项目却没有发生太大变化,“当时不热时出来创业的团队,相对来说更靠谱一些。现在出来的很难搞清楚是不是追热点,能否长期坚持。”米磊认为,这个赛道的创业者要比拼技术实力、资金实力、管理能力、战略耐力等方方面面的能力,战况很激烈。

米磊觉得,大模型的成功还在于有长期的耐心,“只要长期投入,一旦爆发就会创造巨大的商业价值,但中国的投资人有几个敢愿意这样做的。如果能做到这一点,我相信中国一定有未来”。

当下所有人都希望赶上ChatGPT的热度,尽快在这个节点押注,才有可能抓到下一波AI浪潮。这是王啸眼中,很多人现在下场去做一些“看起来短期内没那么正确”的事情。但也很有可能,这波AI热潮留给创业公司的机会,并没有外界想象的那么多。

但真正的竞赛发生在更底层。任博冰说,确实相比美国,中国的公司更加注重应用层的创新,“当然我们也有关注基础技术研究的,只是相对美国的投入有一定的差距。”

每一次革命来临的时候,对于技术双刃剑另一面的讨论从未休止。这一次AIGC的爆发同样没有例外。就在阿里云正式发布通义千问大模型当天,一条监管消息瞬间刷屏。

4月11日,国家互联网信息办公室就《生成式人工智能服务管理办法(征求意见稿)》(以下简称“意见征求稿”)公开征求意见,内容的真实性、训练数据的安全性等备受关注的话题皆在其中。这被视为AIGC领域首份政府文件。

站在学术角度,监管的红线可以理解。中欧国际工商学院中欧国际工商学院战略学及创业学助理教授白果在一次分享中谈到,有学者做过统计,美国在经历数字化转型后,即1979年到2019年间,工资在初次分配中所占的比例以及占整个GDP的比例,总体趋势都是下降的。

“靠工资活着的人所占有的财富或所获得的回报,在整体的回报中所占的比例是越来越低的。这种情况在我们大量使用AIGC后,会不会越演越烈?”白果反问道。

ChatGPT也好,AIGC也好,版权到底属于谁?“因为模型的创作能力并不来源于模型本身,而来源于互联网上已有的大量文字和图片。ChatGPT生成后,它拥不拥有版权?这个版权属于谁?其实是很难解答的问题。”白果说。

无论如何,从百度发布的文心一言到阿里云的通义千问,大模型的中国竞速已经被业界寄予厚望,相比AI换人的忧虑,人们当下或许更关注技术的可能性。

在通义千问大模型发布一周后,钉钉基于大模型能力所披露的“斜杠”,被认为是微软基于ChatGPT大模型能力发布的Copliot的中国版本。演示视频发布时,现场开始有人交头接耳。那是科幻作品中才会出现的场景:如果这种能力未来能够实现,无疑意味着每个拥有AI使用能力的人,都将获得一位能力极强的个人助理。

钉钉总裁叶军说:“这一次人工智能技术的变革,带来的将是每个人都能使用的技术工具。”任博冰也认为,相比此前的技术变革所造成的技术鸿沟,AI2.0反而是拆除了技术使用的门槛,提高了可及性。“我对未来保持乐观。”

(经济观察网 记者 陈白 高若瀛 郑淯心)