谷歌的AI竞赛:起了大早,赶了晚集

转载
474 天前
4446
AI梦工厂

文章转载来源:AI梦工厂

作者:JEREMY KAHN

来源:财富FORTUNE

图片来源:由无界 AI工具生成

加利福尼亚州山景城海岸线露天剧场,谷歌母公司Alphabet首席执行官桑达尔·皮查伊面前观众座无虚席。他正尽最大努力扮演史蒂夫·乔布斯和比尔·盖茨开创的新派科技公司掌门人角色:有点像流行偶像,又有点像教会传教士传达神之旨意,只是方法不再是歌曲或布道,而是软件和硅。可惜说话温和,性格内向的皮查伊天生不太适合这一角色。不知何故,他演讲的氛围更像是高中音乐剧,没有好莱坞剧场的热烈氛围。

早在2016年,皮查伊就宣布谷歌推行“人工智能优先”战略。如今人工智能发展正处于重要时刻,然而谷歌的竞争对手吸引了所有注意力。去年11月ChatGPT亮相让谷歌措手不及,过去六个月里,谷歌忙着推出产品,与ChatGPT研发方OpenAI以及其合作伙伴兼支持者微软竞争。

5月举办的公司年度I/O开发者大会上,皮查伊希望展示过去六个月里谷歌的努力。他介绍了名为“帮我写作”的Gmail新功能,可根据文本提示自动起草整封邮件;谷歌地图里人工智能支持的沉浸式视图,可以构建用户路线的逼真3D预览;生成式人工智能照片编辑工具等等。他谈到了强大的PaLM 2大型语言模型(LLM),正是该技术支持了种种新功能,包括谷歌用来对标ChatGPT的Bard。他还提到正在开发的强大人工智能模型家族,名为Gemini,可能大幅拓展人工智能的影响,也会放大其中风险。

不过现场和观看直播的观众们最希望听到的话题,皮查伊却避而不谈,即谷歌到底有什么计划?毕竟,搜索是谷歌的核心产品,去年收入超过1600亿美元,约占Alphabet总收入的60%。如今人工智能聊天机器人可以从全网络搜集信息回答用户,不再以链接列表形式而是以对话形式提供,对谷歌这台利润机器有何影响?

皮查伊对此闪烁其词。“我们正以大胆和负责任的方式重新构想所有核心产品,包括搜索,”皮查伊说。如此介绍关系公司命运,与他自身将来也息息相关的产品,实在低调得有些奇怪。之后皮查伊的演讲中,从每一轮不温不火的礼节性掌声中就能感受到观众的不耐烦。

然而皮查伊再没触及关键话题。他选择让谷歌搜索副总裁凯茜·爱德华兹介绍名字有些尴尬的“搜索生成体验”(SGE)。该功能结合了搜索和生成式人工智能,用户搜索时可提供单独一份摘要“快照”答案,以及证实答案的网站链接。用户可以继续提问,就像使用聊天机器人一样。

新产品有可能成为强大的答案生成器。但能带来收入吗?这正是谷歌面临的创新者困境核心。

Alphabet表示,SGE属于“实验”。不过皮查伊明确表示,SGE或同类产品将在未来的搜索领域发挥关键作用。6月,皮查伊对彭博社(Bloomberg)表示,“类似产品将成为主流搜索体验的一部分”。这项新技术显然还未达到预期目标。SGE速度相对较慢,而且跟其他生成式人工智能一样,容易出现计算机科学家所谓的“幻觉”,即自信地提供虚假信息。皮查伊也承认,在搜索引擎中这一问题可能存在危险。他告诉彭博,如果父母在谷歌上搜索儿童应服用泰诺的剂量,“完全不能出错。”

从SGE的推出,能看出在人工智能军备竞赛中谷歌的反应速度。该技术借鉴了谷歌在人工智能和搜索领域数十年的经验,充分展示了Alphabet的火力。不过也暴露了大变革之际Alphabet的脆弱性。聊天机器人的信息收集可能蚕食谷歌的传统搜索业务,及其利润丰厚的广告驱动商业模式。不幸的是,比起熟悉的谷歌链接列表,很多人更喜欢ChatGPT的答案。“现在人们熟知的搜索行将消失,”研究公司Forrester的分析师杰伊·帕蒂萨尔如此预测。

因此,皮查伊和Alphabet不能弄错的不仅仅是泰诺剂量。谷歌拥有强大的人工智能工具,却未制定与Alphabet身为全球第17大公司的广告收入相匹配的战略。如何应对转变,将决定未来十年里谷歌不管作为动词还是一家公司能否继续生存。

ChatGPT推出时,一些评论家认为意义接近iPhone或个人电脑问世;还有些人更为激进,认为聊天机器人堪比电动机或印刷机。但在很多高管、资金经理和技术人员看来,有件事从一开始就很明显:ChatGPT是直指Alphabet心脏的匕首。ChatGPT刚亮相几个小时,使用该聊天机器人的用户就称之为“谷歌杀手”。

尽管ChatGPT无法访问互联网,不过观察人士准确地猜到,让人工智能驱动的聊天机器人访问搜索引擎以提供答案相对容易。处理多重查询时,ChatGPT统一响应似乎比必须通过多个链接拼凑信息要方便。此外,聊天机器人还能编写代码、创作俳句、写高中历史论文、制定营销计划和提供生活指导。这些谷歌搜索都做不到。

到目前为止,微软已向OpenAI投资130亿美元,而且迅速宣布将OpenAI的技术集成到搜索引擎必应中,之前必应的市场份额从未超过3%。评论人士认为,本次整合可能是必应彻底击垮谷歌搜索的最佳机会。微软首席执行官萨蒂亚·纳德拉打趣道,谷歌是搜索领域的“无敌巨人”,然后补充说,“我想让人们知道,我们能让巨人起舞。”

比起一些认为谷歌太过官僚主义、迟钝得无法起舞的评论人士,纳德拉对谷歌的“舞蹈技巧”信心还要强一些。长期以来,谷歌世界级的人工智能团队一直是科技界羡慕的对象。2017年,谷歌研究人员发明了支撑生成式人工智能热潮的基本算法,称为transformer的人工神经网络。(ChatGPT中的T就是“transformer”。)然而Alphabet似乎搞不清如何才能将研究转化为能激发公众想象力的产品。2021年谷歌还创建了名为LaMDA的聊天机器人,功能相当强大。LaMDA的对话技巧堪称一流。但就像其他大语言模型一样,这款机器人的反应可能不准确,存在偏见,有时只是奇怪和令人不安。由于问题并未解决,而且人工智能社区想解决确实很难,谷歌担心急着发布不负责任,会对声誉造成风险。

或许还有一点同样重要,聊天机器人并不太符合谷歌的主要商业模式——广告。与谷歌搜索相比,总结式答案或对话流提供的广告投放或赞助链接机会似乎少得多。

在很多人看来,此次冲突暴露出更深层次的文化障碍。一些前员工称,谷歌对市场主导地位太舒服且过于自满和官僚主义,无法应对迅速的转变,就像2020年谷歌收购生成式人工智能企业家普拉文·塞沙德里的初创公司AppSheet时一样。今年早些时候,他离职后不久写了一篇博客,称谷歌存在四大核心问题:没有使命、没有紧迫感、特殊主义妄想和管理不善。他说,所有问题都源于“拥有名为‘广告’印钞机,保持逐年增长,却掩盖了其他错误。”

还有四位过去两年离开谷歌的前员工也有类似描述。(由于担心违反离职协议或损害职业发展,他们接受《财富》杂志采访时要求匿名。)“仅仅想改进现有功能,就得忍受大量繁琐程序,更不用说研发新产品,令人难以置信,”其中一人表示。另一位前员工表示,谷歌经常把庞大用户群和收入当做借口,不接受新想法。“他们把影响的标准定得太高,几乎没什么办法绕过,”另一位说。

类似的内部不满情绪只会助长更广泛的说法:谷歌麻烦大了。从ChatGPT发布到元旦的五个星期里,Alphabet公司的股价下跌了12%。

到去年12月中旬,谷歌内部出现了恐慌迹象。《纽约时报》(New York Times)报道称,Alphabet为赶上OpenAI和微软拉响了“红色警报”。2019年谷歌联合创始人拉里·佩奇和谢尔盖·布林已经辞去日常职责,只通过超级投票权股份控制公司。现在两人突然返回,有报道称布林卷起袖子帮忙编写代码。

联合创始人突然回归,很难说是对皮查伊领导能力的支持。不过谷歌高管认为,佩奇和布林的返回,以及最近的争夺背后都是热情而非恐慌。“必须记住,拉里和谢尔盖都是计算机科学家,”Alphabet全球事务总裁肯特·沃尔克表示。“两人都对未来的可能性很兴奋。”后来皮查伊在接受《纽约时报》播客采访时表示,从未发布“红色警报”。不过他承认“要求团队紧急行动”,寻找办法将生成式人工智能变成“深刻、有意义的体验”。

外部刺激显然产生了效果。今年2月,谷歌宣布推出与ChatGPT正面竞争的Bard。到3月,谷歌介绍了Workspace写作助手功能,以及Vertex人工智能环境,该环境可以帮助云客户利用自己的数据训练并运行生成式人工智能应用。在5月的I/O开发者大会上,谷歌几乎每款产品都闪耀着新一代人工智能光辉。一些投资者对此印象深刻。I/O大会后,摩根士丹利(Morgan Stanley)分析师立即写道,该公司的“创新速度和推向市场节奏提升”。ChatGPT推出后谷歌股票一度跌至每股88美元,等到皮查伊在山景城登台时,股价已超过122美元。

疑云仍未消散。“谷歌有很多内在优势,”股票研究公司Arete research的创始人理查德·克莱默表示,毕竟谷歌拥有无可匹敌的人工智能研究成果,还能访问全世界一些最先进数据中心。“谷歌只是在商业上没有尽全力推进,”他补充道,谷歌各部门和产品团队过于孤立,很难在公司层面展开合作。(到目前为止,人工智能冲击下谷歌对组织架构最明显的调整是将两项领先的人工智能研究项目,即总部位于山景城的谷歌大脑和总部位于伦敦的DeepMind合并为名为GoogleDeepMind的实体。)

除了Arete分析师,也有其他人认为谷歌并未实现潜力。摩根士丹利指出,尽管最近Alphabet有所复苏,但仍存在“估值差距”。之前其股价一直高于苹果、Meta和微软等其他科技巨头,但截至7月谷歌市盈率比竞争对手低约23%。在很多人看来,这说明市场认为谷歌无力摆脱人工智能的困境。

38岁的杰克·克劳奇克是谷歌的“二进宫”员工。他在20多岁时加入谷歌,2011年离开去一家初创公司,后来在流媒体广播服务Pandora和WeWork。2020年,他返回公司开发谷歌助手,用来应对苹果的Siri和亚马逊的Alexa。

谷歌的LaMDA聊天机器人让克劳奇克很感兴趣,他想知道聊天机器人能否改进智能助手的功能。“2022年大部分时间里,可能还要加上2021年,我一直在说这件事,”克劳奇克表示。面临的阻碍是可靠性,即持续存在的“幻觉”问题。用户能接受很自信然而事实错误的答案吗?

“我们一直在期待宣布‘准备好展开极其说服力的互动’ 那一刻,” 克劳奇克说。去年秋天,“我们开始发现一些信号”,他说,有些不好意思地略过了ChatGPT大受欢迎一事。

如今,克劳奇克是Bard团队高级产品总监。尽管该产品借鉴了谷歌多年来的研究,不过Bard确实在ChatGPT推出后很快就完成开发。2月6日,谷歌发布新款聊天机器人,几天后微软推出必应聊天。谷歌不愿透露该项目有多少员工参与。不过从一些迹象可看出,公司正面临压力。

ChatGPT反应流畅的秘密之一是,通过被称为人类反馈强化学习(RLHF)的过程进行微调。具体想法是让人类给聊天机器人的反应评分,人工智能逐渐学会调整答案努力接近高分版。一家公司可训练的对话越多,聊天机器人表现可能就越好。

短短两个月ChatGPT获得1亿用户,OpenAI通过大量对话实现遥遥领先。为了迎头赶上,谷歌雇佣了合同评估人员。一些为外包公司Appen工作的合同人员后来向美国国家劳动关系委员会(National Labor Relations Board)提出投诉,称因公开谈论收入过低和截止时限不合理被解雇。其中一人告诉《华盛顿邮报》(Washington Post),哪怕是Bard对内战起源等复杂话题的长文回答,评分员只有五分钟时间打分。合同人员担心,时间压力会导致评分有缺陷,影响Bard的安全性。谷歌表示,问题主要出在Appen与员工之间,评分只是用于培训和测试Bard的众多数据点中的一块;训练仍在快速进行。另有报道称,谷歌尝试使用竞争对手ChatGPT的答案培训Bard,因为之前不少用户将对话发布在ShareGPT网站上。谷歌否认利用相关数据。

与新款必应不同,Bard尽管可以提供相关网站链接,却不是搜索工具。克劳奇克说,Bard的目的是成为“创意合作者”。据他介绍,Bard的主要作用是从用户自己的大脑中找回想法。“获取脑海中的关键信息,抽象概念,然后扩展,”他说。“最终是增强想象力。”克劳奇克说,谷歌搜索就像望远镜,而Bard像面镜子。

到底人们在Bard的镜子里看到了什么,现在还很难说。聊天机器人的首次亮相很不稳定:在发布Bard的博客中,其输出的截图中存在错误说法,即2021年发射的詹姆斯·韦伯太空望远镜拍摄到太阳系外行星的第一张照片。(事实上是由2004年一台地球上的望远镜拍摄。)事实证明,这一错误价值1000亿美元:记者报道该错误后的48小时内Alphabet缩水的市值。与此同时,谷歌警告员工不要过于相信Bard:谷歌在6月发布了一份备忘录,提醒员工如果未仔细核查,不要依赖Bard或其他聊天机器人在代码方面的建议。

Bard首次亮相以来,谷歌已将聊天机器人的人工智能升级为PaLM 2 LLM。根据谷歌发布的测试,PaLM 2在推理、数学和翻译一些领域的基准方面优于OpenAI的顶级模型GPT-4。(一些独立评估者并未得出相同结果。)谷歌还做了一些调整,极大改善了Bard对数学和编码查询的反应。克劳奇克说,其中一些调整降低了Bard产生幻觉的可能,不过问题远未解决。“没有能产生‘x,’的最佳实践, ” 他说。“这就是Bard仍是试运行的原因。”

谷歌拒绝透露Bard用户数量。不过从第三方数据可看出迹象:Similarweb数据显示,Bard网站访问量从4月的约5000万增加到6月的1.426亿,远远落后于同月ChatGPT的18亿次访问量。(7月,谷歌将Bard推广到欧盟和巴西,将回答的语言范围增加了35种,包括中文、印地语和西班牙语。)相关数字与谷歌主要搜索引擎相比相形见绌,搜索引擎每月访问量为880亿次,日搜索量85亿次。根据StatCounter的数据,必应聊天推出以来,谷歌的搜索市场份额略有增加,达到93.1%,而必应在搜索市场占有率基本保持不变,为2.8%。

必应显然不是人工智能对搜索的最大威胁。5月,彭博行业研究(Bloomberg Intelligence)对美国650人进行的一项调查显示,在16岁至34岁的人群中,60%的人表示更喜欢向ChatGPT提问,而不是用谷歌搜索。“年轻群体可能推动在线搜索方式彻底转变,”彭博行业研究高级技术分析师曼蒂普·辛格表示。

这正是SGE的用武之地。谷歌搜索业务副总裁伊丽莎白·里德表示,谷歌新款生成式人工智能工具可以向用户提供比传统谷歌搜索更复杂的多步骤查询答案。

仍有很多问题需要解决,尤其是在速度方面。谷歌搜索能立即返回结果,然而用户想看到SGE返回的快照必须等待几秒钟,体验不佳。“技术的乐趣之一是处理延迟,”里德在I/O大会之前一次演示中苦笑地告诉我。随后一次采访中,她表示谷歌在速度方面取得了进展,并指出用户使用SGE有可能容忍获得明确答案之前存在短暂延迟,毕竟不必再花10分钟点击多个链接自行寻找答案。

用户还发现SGE存在抄袭行为,即从网站逐字逐句地提取答案,还不提供原始来源链接。这反映了生成式人工智能特有的问题。“这项技术有一点本质上很棘手,因为经常不知道其信息来源,”里德说。谷歌表示,将继续了解SGE的优势和劣势并做出改进。

最大的问题是,谷歌不知道生成式人工智能内容广告的利润能否比得上传统搜索。“我们正继续试验广告,”里德说。其中包括在SGE页面不同位置放置广告,以及里德提到的在快照答案中内置“原生”广告,不过谷歌必须明确告知用户哪些部分为广告。里德还表示,谷歌正考虑如何在SGE页面中添加额外“出口”,向用户提供更多链接到第三方网站的机会。

对依赖谷歌搜索结果提升网站流量的出版商和广告商来说,如何解决“退出”问题至关重要,这些人已然很紧张。有了快照答案,人们点击链接的可能性可能大大降低。新闻出版商尤为愤怒:按照目前LLM运行方式,谷歌基本上是无偿从新闻网站上抓取信息,然后利用相关数据建立人工智能,此举可能彻底击垮新闻报道业务。多家大型新闻机构已开展谈判,要求谷歌每年支付数百万美元才允许其访问内容。7月,美联社(Associated Press)成为第一家与OpenAI签署协议的新闻机构,具体财务条款没有披露。(7月,微软搜索主管乔迪·里巴斯在《财富》科技头脑风暴会议上告诉观众,公司内部数据显示,必应聊天用户比传统必应搜索的用户点击链接可能性更高。)

当然,如果人们不点击链接,同样会对Alphabet构成生存威胁。占谷歌80%收入的广告商业模式是否最适合聊天机器人和助手,目前还不好判断。例如,OpenAI为ChatGPT Plus服务选择了订阅模式,每月向用户收取20美元。Alphabet旗下有诸多订阅业务,从YouTube Premium到Fitbit可穿戴设备的各种功能。但利润都比不上广告。

而且广告以外业务增长乏力。2022年,谷歌非广告收入(不包括其云服务和“其他押注”公司)增长率仅3.5%,为290亿美元,而广告收入增速为两倍,达到2240亿美元。谷歌是否能将大量习惯于免费互联网搜索的人转变为付费用户,这一点尚不清楚。彭博行业研究人工智能调研中另一个不太妙的发现是,各年龄段的多数人(93%)表示,不接受人工智能聊天机器人每月费用超过10美元。

如果生成式人工智能确实成为搜索杀手,谷歌还能从哪寻找增长点?云业务可能受益。长期以来谷歌一直将人工智能能力融入云服务中,分析人士表示,这一趋势激发了客户兴趣。过去一年中谷歌是唯一市场份额增长的大型云提供商,市场份额上升至11%。2023年一季度谷歌云也首次实现盈利。

Arete Research的克莱默指出,尽管实现增长,谷歌要赶上竞争对手还有很长的路。亚马逊和微软的云产品规模都远超谷歌,利润也高得多。此外,与人工智能相关的竞争也很激烈:ChatGPT热潮导致很多商业客户通过微软的Azure Cloud使用OpenAI的LLM技术。

更广泛地说,迄今为止谷歌的生成式人工智能举措大多是应对OpenAI和微软攻击的防御性策略。为赢得下一步竞争,谷歌必须主动进攻。多位专家一致认为,接下来的重点是人工智能系统,不仅可以生成内容还能在互联网上行动,代表用户操作软件。未来的人工智能将是“数字代理人”,能订购食品杂货、预订酒店房间,还能搜索页面之外管理生活——例如通过Alexa或Siri提醒服用类固醇。

“无论哪家公司赢得个人代理战争,都是大事,因为用户再也不会去搜索网站,再也不会上生产力网站,再不会去亚马逊了,”比尔·盖茨5月表示。他说,如果微软不尝试开发代理会很失望。他还投资了DeepMind联合创始人穆斯塔法·苏莱曼创办的初创公司Inflection,该公司表示目标是培养个人人工智能“大管家”。

谷歌调侃了即将成立名为Gemini的更强大人工智能模型家族。皮查伊表示,Gemini将“在工具和API集成方面效率很高”,明确暗示Gemini可以助力数字代理。另一个信号是,2022年底谷歌DeepMind发表了名为Gato的人工智能研究,专家们认为这可能是Gemini的前身。

Bard团队的克劳奇克承认数字代理让人兴奋,但他也指出,从助理转变到代理需要谨慎,才能在谷歌限制的范围内“负责任”。毕竟,能在现实世界中行动的代理比单纯的文本生成器可能造成的伤害更大。而且有一点让问题更加复杂,即人们往往不善于下指令。“人们的指令往往提供的背景不足,”克劳奇克说。“我们希望这些工具能读懂我们的想法。然而实际上做不到。”

正是出于类似担忧,谷歌的未来将取决于监管态度。7月底,白宫宣布,包括谷歌在内七家顶级人工智能公司自愿承诺围绕人工智能模型的公开透明、安全测试和安全性采取几项措施。不过国会和拜登政府很可能额外设置障碍。在欧盟,一项即将通过的人工智能法案要求人工智能培训数据透明且严格遵守数据隐私法,可能给Alphabet带来挑战。谷歌全球事务主管沃尔克肩负着闯过重重关卡的艰巨任务。“各国应该努力推出最合适的人工智能监管规定,而不是抢先出台规定,”他说,暗示前路漫漫。

沃尔克是莎士比亚粉丝,在准备采访他的时候,我问Bard莎翁作品中有没有类似Alphabet当前面临的创新者困境。Bard提出了《暴风雨》(The Tempest)中的普洛斯彼罗。和Alphabet一样,普洛斯彼罗一直是岛上的主导力量,利用魔法统治,就像Alphabet利用在搜索和早期人工智能领域的霸主地位统治一样。普洛斯彼罗的魔法召唤出一场风暴,将对手冲上了岛屿,随后他的世界被颠覆。事实上,这一比喻相当恰当。

然而当我向沃尔克问起莎翁作品与当下的相似之处时,他引用了《麦克白》(Macbeth)中的一句话,班柯对三个女巫说:“要是你们能够洞察时间所播的种子,/知道哪一颗会长成,哪一颗不会长成,/那么请对我说吧;我既不乞讨你们的恩遇,/也不惧怕你们的憎恨。”

“人工智能就是这么做的,”沃克说。“先观察一百万颗种子,了解哪些种子可能长成,哪些种子可能不会长成。因此,人工智能是协助预测可能发生事情的工具。”

不过人工智能无法告诉沃尔克或皮查伊,谷歌有没有找到解决传统搜索面临终结的方法。就目前来看,不管是莎翁还是Bard都无法回答这一问题。 (财富中文网)

本文发表于2023年8月/9月的《财富》杂志,标题为《桑达尔·皮查伊和谷歌面临1600亿美元困境。》(Sundar Pichai and Google face their $160 billion dilemma)

译者:梁宇

审校:夏林