CopytoChina难以复现,中国的大模型机会在何处?

转载
364 天前
6286
AI之势

文章转载来源:AI之势

作者|武静静 编辑|赵健

来源:甲子光年

图片来源:由无界 AI工具生成

几天前,GPT-4救回了一只宠物狗。

事情是这样的。有一天,网友库珀发现自家小狗表现异常,有贫血的症状,就去诊所检查。医生诊断小狗患有蜱传疾病,回家后,库珀按医嘱照顾小狗。

没想到过了几天,小狗的身体再次出现问题,牙龈发白,贫血症比之前更严重。库珀再次去了诊所,医生却说,他也不知道怎么回事,建议看小狗后续情况。库珀无法接受这种说法,慌乱中只能找其他诊所寻求建议。

同时,他想到了GPT-4曾提到擅长医疗诊断,决定试试——库珀详细描述了小狗的情况并给GPT-4提供了小狗多次的血液检测结果,要求GPT-4给出诊断意见。

库珀提问的部分信息

在说了“我不是兽医……”的免责声明之后,GPT-4给出了导致小狗贫血的多种潜在可能,并提供了一个潜在问题列表。结合此前的检测结果,库珀排除了其他可能,留下了一个最符合目前情况诊断结果——IMHA(免疫性溶血性贫血)。

GPT-4针对库珀给出的其中一个问题的回复

库珀把这个诊断结果告诉了给小狗看病的第二家诊所,医生同意并进行了血液检测。最终,小狗确诊患有IMHA,并进行了对症治疗。

小狗成功获救,库珀激动地在推特上分享了这则好消息。“当然,这并不能说明GPT-4就是一个好医生,但毫无疑问,它应该成为专业人士用来帮助他们挽救更多生命的工具”,库珀说。

库珀不是第一个受益于新技术的人,从ChatGPT到GPT-4,AI涌现出惊人的理解和生成能力以及强大的知识和技能储备,正在让更多普通人享受到新技术带来的便捷——借助新一代的AI,人们不仅可以让聊天机器人“写专属童话故事疗愈自己”“写处理指定任务的代码”“充当自己的英语老师”,还可以让它们直接帮忙订机票以及检索个人知识库信息。此前,人们要么靠自己,要么依赖某一领域的专业人士来处理这些任务。

AGI(通用人工智能)时代来了。上周,微软发布报告释放了这一信号。报告提到,GPT-4已明显超越 ChatGPT,可以被视为AGI的早期(但仍不完整)版本,其不仅掌握了语言,还可以在无需任何特殊提示的情况下,解决跨越数学、编程、视觉、医学、法律、心理学等领域的困难任务,并且能力非常接近人类水平。

就连技术乐观主义者都惊讶于AGI会来得如此之快,不由感叹:“知道AGI肯定会到来,以为是几年后,或者十几年后,万万没想到是现在。”

热潮跨越海洋传递到了中国。在OpenAI和微软接二连三的产品“轰炸”下,国内市场直接炸锅,投资人熬夜扒论文,创业者赶赴国外取经,大厂紧急开发对标产品,普通人忙着学攻略,此前忙着“聚焦”“下沉”“保持沉默”的AI行业再次热闹起来。

“人工智能的iPhone时刻”“AI2.0 时代到来”“颠覆性的创业机会”“下一代的操作系统”——人们给这个时刻赋予了各种代表时代变革意义的宏大名称。GPT-4背后的大模型技术以及相关应用成为了投资人和创业者眼中不可错失的新风口。

大模型技术带来的生态机会究竟在何处?我们又该如何抓住这波新技术浪潮?此次,「甲子光年」采访了业内数位投资人和创业者,试图还原不同人眼中对于大模型生态机会的理解和下注的方向,寻路中国AI行业未来的可能走向。


1.比移动互联网还要颠覆性的平台性机会?


“这绝对是比移动互联网还要颠覆性的机会”,一位投资人说。

这个观点放在去年11月ChatGPT发布之后,会被很多人认为有些言过其实。但眼下,更多人觉得自己的想象力跟不上OpenAI以日为单位的进化速度。

去年发布ChatGPT后,OpenAI自己都没意识到会在几个月后引发如此大的行业震动。它原本只是一个花了两周时间赶鸭子上架的“测试品”,主要为后续推出GPT-4收集反馈,做铺垫。

这在部分人看来完全称不上是革命性的创新。图灵奖得主Yann LeCun甚至在公开场合说:“ChatGPT不算技术创新,只是组合得很好罢了”。事实上,ChatGPT背后的核心技术确实很多都出自他人之手,比如Transformer是谷歌在2017年提出,自监督学习算法也早就被提倡,强化学习是由DeepMind率先推崇。这也是在一开始很多人将ChatGPT只看作一个产品而非变革性平台的原因。

但一些人从ChatGPT中窥见了AGI的曙光。在使用过程中,人们发现ChatGPT不仅可以聊天、写文章还可以做会议总结、行研分析、写程序,大语言模型第一次展现出如此强大的通用性。

爱丁堡大学博士生符尧在文章中直言:“在国际学术界看来,ChatGPT / GPT-3.5 是一种划时代的产物,它与之前常见的语言模型 (Bert/ Bart/ T5) 的区别,几乎是导弹与弓箭的区别,一定要引起最高程度的重视。”

UCL计算机系教授、上海数字大脑研究院院长汪军告诉「甲子光年」:“ChatGPT惊艳的自然语言生成能力对于机器与人之间交互的影响是变革性的,它让机器人能够充分地理解人的语言表达,从而建立了最便捷的人机连接通路,为此后机器做泛化任务创造了基础前提。”

“和超级聪明的人工智能交个朋友,一个月只用20美元。”一位网友调侃。

如今,这种通用性正在激发新的商业图景。过去几周,OpenAI先后发布了GPT-4、ChatGPT 插件,并开放了API接口,让很多开发者和企业能够直接调用OpenAI背后的大模型能力。各式各样的工具和产品因此而生,ChatPDF、ChatExcel、新的笔记软件……在硅谷几乎每天都有几十个基于OpenAI的新产品上线。

一位硅谷工程师还用GPT-4、Whisper和Monocle AR眼镜搭建制作了RizzGPT,帮人摆脱尴尬的约会和面试氛围。rizzGPT提供的是一种“实时魅力即服务 (CaaS)”,它可以倾听人的谈话,并准确告诉这个人接下来应该说什么话。

最盛行的一种观点是:ChatGPT 是 AI 时代的操作系统。“如果说ChatGPT 的登场是‘iPhone 盛会’,ChatGPT 插件带来的就是‘iOS App Store’盛会”,身在美国的克斯在推特上感叹,“OpenAI可能会使用专有的模型运行他们的App Store,来交叉编译各个插件(应用程序),就算开源的平台也无法与他们竞争,就像Android手机无法获得iOS系统的全部体验一样。”

OpenAI创始人Altman更愿意将大模型定义为新技术平台,借助平台,人人都是开发者。他说道:“新技术会解锁人们构建应用程序的方式,这是移动互联网之后未曾出现过的新机会,所有行业都会受益于此。”在他看来,基于新的技术平台,每个人都可以在自己的口袋里拥有一个量身定制的助手,帮助学习、工作和提供医疗建议,而人们只需要说一句话就可以开启这个专属机器助手。

微软云成为这场开发者盛宴最直接的受益者。今年3月,Azure向B端上线了Azure OpenAI服务,并更新了ChatGPT编码功能,让用户通过Azure,直接调用OpenAI大模型的能力。这意味着,每新增一个使用ChatGPT、GPT4的开发者和企业,微软云就多了一个用户。

云计算之外,微软的野心还瞄准了搜索引擎、SaaS产品等方向。此前,微软已经将ChatGPT整合到必应搜索中,与谷歌直接竞争。另外,微软云也在加码与OpenAI一系列产品的融合。办公软件市场新局开启,GPT-4发布之后,微软隔日就将宣布把GPT-4接入Office套件,推出了全新的AI功能Copilot(副驾驶),帮人直接写项目书、做表格可视化、给PPT写摘要、写邮件、做会议总结、商务聊天。

“一百年后,我们将会回顾这一刻,并说:那是真正的数字时代的开始。”微软副总裁Jared Spataro说。在这个新的起点,微软已经占领“lead time”。


2.  重复造轮子?


美国市场大模型生态创业景象如火如荼,大洋彼岸,中国科技行业也闻风而动。

“寻找或成为中国的OpenAI”成为了最首要的问题。

第一家迅速跟进产品动作的大厂是百度。3月16日,百度发布对标ChatGPT的产品文心一言,并面向企业客户开放文心一言API接口调用服务。3月27日,百度推出了面向企业开发者的文心千帆大模型平台,其推理云调用单价比ChatGPT便宜0.0003美元。“文心一言和ChatGPT可能最多差两个月。”李彦宏在接受36氪采访时说道。

李彦宏直言:“中国的OpenAI不是创业公司的机会,没有必要再重新发明一遍轮子。”

显然,很多人不同意他的观点。目前,美团联合创始人王慧文、创新工场CEO李开复、前搜狗CEO王小川、前京东AI掌门人周伯文、出门问问创始人李志飞都官宣要创业做大模型。“AI 2.0已经到来,会诞生比移动互联网大十倍的平台机会。”李开复称,3月19日,他发布朋友圈称,要亲自筹组Projevt AI 2.0——一个致力打造AI 2.0全新平台和AI-first生产力应用的全球化公司。

更多此前就锚定大模型方向的创业公司也浮出水面。致力于做决策智能的上海数字大脑研究院、做多模态AI大模型的MiniMax、专注于大模型研究和应用的西湖心辰、认知智能公司澜舟科技均是在这波热潮之前就成立的公司。

AI大模型正成为创投领域的香饽饽。最新消息是王慧文创立的新项目光年之外已经与AI架构创业公司一流科技Oneflow达成并购意向。

热闹的B面是现实的隐忧。

“做大模型创业的公司要融到大钱不容易了。”云启资本合伙人陈昱告诉「甲子光年」,他谈到,2021年底在天使轮投资MiniMax的时候,这还是个冷门领域,国内少有人做,但当时由于和MiniMax创始团队很早就认识,云启选择相信这群人的技术信仰以及想做AGI的野心。

在陈昱看来,目前国内市场炒得过热,不少人在跟风,有一些项目就是在鱼目混珠。

对于真正想深耕大模型技术的公司而言,这也是一场注定艰难的战斗,资金、算力、数据、人才,以及更多未知的工程化方法,处处是难题,“没有算力,没有数据,不可能在几个月内就搞出高质量大模型。”陈昱说。

钱是大模型创业最基础的入门条件。2022年,OpenAI花掉了5.44亿美元,收入只有3600万美元。“1年融不到一两亿美金就无法入门。”线性资本资深总监白则人说。

算力也是关键要素,浙商证券的一份研报指出,支撑ChatGPT算力基础设施至少需要上万颗英伟达GPU A100(AlphaGO只需要8块GPU),采购一片英伟达顶级GPU成本为8万元,GPU服务器成本通常超过40万元,一次模型训练成本超过1200万美元。这些都是显性投入。“算力是难题,但可以通过模型加速或者设计专用于Transformer芯片的方式解决,国内已经有公司在探索。”白则人在这一问题上态度乐观。

白则人认为,在数据和场景上,大模型创业公司如何直面来自大厂的竞争压力也是个关键问题。目前,百度、腾讯、阿里、字节、华为都已经公布了自身的大模型技术。“大厂都有自己的数据和场景,对大模型基础层的创业公司而言,工程化落地能力之外,还需要积累足够高质量的数据和可应用的场景才能和大厂比拼。”

比算力和数据更稀缺的是人才。云启资本合伙人陈昱告诉「甲子光年」:“大模型平台具有强技术属性,需要顶级的工程师来把控方向,目前国内这方面的人才比较稀缺,拿到钱也不一定能在短时间内找到合适的人。”

从王慧文发布英雄榜一个多月以来都没找到首席科学家的情形来看,找人确实是个大难题。

“这注定是属于少数人的游戏,最终大模型基础平台层会剩下三四家创业公司。”陈昱说。


3. 先做基础模型还是先做上层应用?


大厂和创业公司争相竞跑大模型平台性机会的同时,中国的大模型生态逐步走出了一幅与美国市场迥异的图景。

最显著的差异就是大模型公司做技术和应用的优先级不同。

一直以来,OpenAI把主要精力都放在了致力于让大模型技术实现通用性上,用这种通用能力来解决垂直领域的问题,所以在美国市场,我们看到的大模型生态机会形成基础层-中间层-应用层的分工。其中, OpenAI的定位就是成为新的基础设施,做大模型平台,平台之上,中间层和应用层的公司来负责将技术抵达垂直场景。

比如,Notion、Salesforce等公司选择直接调用ChatGPT的能力服务用户。此前,SaaS企业Jasper就是基于GPT-3开源的API,帮助企业和个人用户写营销文案和AI绘画。2022年10月,Jasper估值达到15亿美元。

百度也在倡导这种“分层式”大模型生态机会,李彦宏在文心一言发布会分享称:

  • 第一类是新型云计算公司,云计算主流商业模式将会从IaaS变为MaaS。
  • 第二类是进行行业模型精调的公司,介于通用大模型和企业之间的中间,这类企业可以基于对行业的洞察,调用通用大模型能力,为行业客户提供解决方案。
  • 第三类是应用层的企业,基于通用大语言模型开发应用服务,这可能才是真正的机会。

有更多中国创业公司认为中国特色的大模型之路与美国市场不同。他们探索出一种“两条腿走路”的方式,即一边做大模型基础平台开发,一边直接瞄准垂直的行业场景落地。

创新工场孵化的澜舟科技就是这样一家公司。澜舟科技成立于2021年6月,主要产品是基于“孟子大模型”核心技术打造的一系列能力平台和垂直场景应用,公司新推出的孟子MChat可控大模型拥有机器翻译平台、金融NLP、AIGC智能创作等多个企业级解决方案。

“中国公司拥抱大模型的同时,要审时度势,要注重落地,尤其是to B落地。”澜舟科技创始人周明说。

前京东AI的掌门人周伯文在2021年创立的衔远科技也选了这条路:垂直整合从自有基础大模型到应用、用户全场景闭环,其产品ProductGPT与ChatGPT很像,是一款多轮对话类AI产品,在3C、消费品、美妆等领域,ProductGPT比ChatGPT给出的回复更加专业。这条路更接近垂直类大模型。

“中国与美国的情况完全不同,中国OpenAI需要探索一条新的道路。”周伯文说。

这种“两条腿走路”的发展也并非易事。“创业公司资源是有限的,就像云厂商很难把SaaS做到底一样,对于初创公司而言,优先开发大模型技术,还是直接切入细分行业做场景是个单选题而不是多选题。”云启资本合伙人陈昱告诉「甲子光年」。

但中国的科技公司确实需要在早期就考虑到现实的商业落地问题,这是一个两难的局面。

一些人还在失落,中国AI行业怎么就落后了呢?一些人更关心接下来的答案,中国大模型公司能赶得上OpenAI吗?

有人乐观。线性资本资深总监白则人认为,虽然具体工程化的弯路和难题需要时间去攻克,但国内两三年内做出类似ChatGPT 80%能力的产品概率很大,即使很难超越OpenAI已经建立起来的1亿用户和数据规模优势,但只要国内创业团队能做出初步可用的产品,接下来就会出现海量的开发者机会。

也有人觉得后发者未必没有机会,“大模型确实存在工程化的难题,但护城河不像芯片,还没有那么深厚,随着参数规模的增大,可能会遇到规模化的瓶颈,等模型能力慢下来之后,后来者就有机会。”

更多人在呼吁回归技术本质,“国内市场需要接受专注技术工具的公司,才有可能真正的做到通用人工智能,但这需要漫长的时间以及坚定的技术信仰。”UCL计算机系教授、上海数字大脑研究院院长教授汪军告诉「甲子光年」。

“这条路上,时间不是问题,信心和决心更重要。”汪军说。


4. 应用层机会:国内更看重to B端


不论这场大模型平台的最终竞赛结果如何,都不会影响应用层公司们的前仆后继。李彦宏对大模型应用层公司的百花齐放非常看好,他说:“真正的机会在应用层,将会有更多的杀手级应用、现象级产品出现。”

目前国内很多投资人已经把重心从大模型基础层平台转移到更广阔的应用层机会上,“中国会有自己的大模型,但线性更关注未来真正智能的场景应用。”线性资本资深总监白则人说。

这是一场所有公司都可以参与的游戏。UCL计算机系教授、上海数字大脑研究院院长教授汪军告诉「甲子光年」:“Model As A Service 的模式下,基于大模型技术开发的各种应用可以服务于各行各业,比如将大模型能力和数据库、机器人、智能汽车指令同步后,就可以用自然语言的方式让聊天机器人直接操作这些软硬件。”

在云启资本合伙人陈昱看来,应用层的机会中,80%的应用机会和2018年、2019年的一致,“只是由于大模型的通用能力,这些应用的技术路径发生了变化;有20%的应用是大模型平台机会下新诞生的,比如用自然语言能力自动生成代码等,对于开发者而言是革命性的。”

对于很多to B公司而言,大模型平台能力带来的是一次全新的效率革命,也会实现此前无法达成的定制化服务。比如对智能合同赛道的法律人工智能公司幂律智能而言,公司的技术路径和产品就会在这次大模型平台机会中迎来全新的变化。

幂律智能创始人涂存超告诉「甲子光年」,此前,公司做合同审查的路径是梳理知识-数据标注-训练模型,此后公司可以借助聊天机器人进行信息抽取,“相当于取缔了数据标注训练模型的过程,此前这个过程成本高且耗时。”他也坦言,在一些特别专业的知识方面,还存在一些通用大语言模型无法很好解决的问题,需要沿用之前的技术路径。

涂存超谈道,大语言模型的通用能力也让公司能够做以前投入产出非常低的产品和项目,“在合同审查的业务中,以前由于成本很高,无法低成本高效的响应客户个性化的合同审查需求,比如在合同台账检索的场景中,面对‘公司Q1超过50万的合同有哪些,和某公司的合同付款条款怎么约定的’这些问题,以前需要检索、筛选,现在直接问机器人就可以。”

涂存超透露,公司的商业化路径也因此发生了变化,“目前主要客户是中大型企业,现在也在开始探索通过ChatGPT的能力给小微企业提供合同相关法律服务服务。”据悉,目前,幂律智能联合清华大学人工智能研究院、智谱AI、面壁智能、OpenBMB,即将发布基于中文千亿大模型的法律ChatGPT。

像幂律智能一样,很多to B公司都会在大模型技术平台的加持下走出新的商业化局面。线性资本资深总监白则人认为,当前已经从特定场景下的能用(AI +)进化到泛化场景的好用(AGI x),AIGC 会带来范式级别的创新,可能会给未来十年带来新的万亿美金的机会。

变量之下,也会有AGI时代全新的应用诞生。白则人提到,AGI native应用是全新的方向,“比如通过自然语言的方式直接分析处理数据,做企业决策服务等。此外,国内有不同于国外的软件生态,比如很多软件没有部署在云端,存在数据可触达性的问题,会探索出新的方式和应用。”

在他看来,这次的AGI浪潮会加速国内企业拥抱数字化的工具,企业服务赛道会迎来新的机会。

AGI+B端应用前景被广泛看好的同时,AGI+C端应用也正在成为热门。国内公司已经开始尝试,比如创业公司聆心智能就在打造场景化、人格化的ChatGPT,公司打造的“超拟人大模型”核心技术是可控、可配置、拟人化,通过简单设置即可构造一个类人智能体。“AGI时代的AI,每个智能体除了‘能做助手’,都应该有个性、人设、情感、风格,能和人建立深度的情感和社交链接,这才是人和AI共生的核心”,聆心智能创始人黄民烈告诉「甲子光年」。

虽然AGI+C端的机会看上去更大,但在国内也面临着更多现实挑战。

这与国内C端用户对数字产品的付费意愿直接相关。一位科技领域投资人告诉「甲子光年」:“To C公司的天花板比to B公司高,但中美市场的付费意愿截然不同,Midjourney一年可以实现1000万用户和1亿美元营收,在中国就不一定。所以国内to B的机会反而更普遍。”

另一种对于未来应用层机会的担忧是,随着规模化能力的加强,大模型AGI会不会直接吞噬很多应用层的机会?

从目前GPT-4展现的能力来看,通用能力比ChatGPT更强,未来GPT-5的能力如果再上一个台阶,很多应用层的产品有可能会被直接替代。

“有点像应用开发速度和大模型迭代速度的比拼”,一位从业者在播客《科技早知道》中说道。

有人觉得速度不会那么快。因为to B产品和服务考验的是垂直行业的认知能力、销售能力、服务能力,随着时间的积累,经验优势就是壁垒;而to C产品如果已经建立起品牌效应和用户认同,也很难被直接替代。也有人觉得机器进化的速度已经超乎想象,未来一切皆有可能。

新的想法和观点还在持续产生,大模型生态机会的共识也在形成的路上,对于从业者而言,或许比下判断更重要的是倾听更多不同的声音。