报告:从研究、产业、政策等角度看2023年人工智能现状

转载
369 天前
2171
36氪

文章转载来源:36氪

原文标题:《2023 年人工智能现状报告》

作者:36氪旗下编译团队神译局 boxi

图片来源:由无界 AI生成‌‌

明年也许人工智能生成的歌曲将打入Billboard十大金曲排行榜

编者按:对于我们这个日益数字化、数据驱动的世界来说,人工智能是技术进步的力量倍增器。因此,了解人工智能的发展现状对我们的工作就显得十分重要了。这份《2023年人工智能现状报告》从研究、产业、政治、安全等方面对人工智能的现状进行了总结,并对未来12个月的人工智能发展情况做出预测,希望能帮助你了解人工智能的发展动态。文章来自编译。


研究


2023 年当然是大语言模型(LLM)之年,OpenAI 的 GPT-4 震惊了世界,它成功击败了所有其他 LLM——不管是在经典的人工智能基准测试上,还是在针对人类设计的考试上。

GPT-4的能力碾压其他的大模型:OpenAI不仅用经典自然语言处理基准对其进行过测试,还用了一些评估人类的测验来测试(如律师资格考试、GRE、力扣等);GPT-4在幻觉问题上表现也好于之前的模型

出于对安全与竞争的担忧,我们发现人工智能在开放性上已经有所减弱。 关于GPT-4 ,OpenAI只发布了信息非常有限的技术报告,谷歌对 PaLM2 也没有透露多少内容,Anthropic更是一点技术资料都不透露,不管是 Claude……还是 Claude 2。

不管是科技巨头还是初创企业,领先的公司对自己的人工智能技术细节开始遮遮掩掩

不过,Meta AI 以及其他公司却站了出来,通过开发并发布足以与 GPT-3.5 的众多功能相媲美的开源 LLM 来让开源的火焰继续燃烧。

Meta开源了LLaMa,从而掀起了一场大模型的开源竞赛,在开源模型的帮助下,一些人开始对模型进行微调,开发出针对垂直领域的应用

从 Hugging Face 的排行榜来看,开源比以往任何时候都更加活跃,下载量以及模型的提交量军飙升至历史新高。值得注意的是,在过去 30 天内,LLaMa 模型在 Hugging Face 上的下载量已超过 3200 万次。

Hugging Face已经变成开源人工智能的大会堂,与22年相比,23年上面的数据集、空间与模型数量均有了显著增长

虽然我们有很多不同的基准(主要是学术性的)来评估大语言模型的性能,但这些不同的评估标准似乎最大的的共同点,也是最大的科学与工程基准是这个:(用户的)“共鸣”

随着开源与闭源语言大模型的增多,随着训练数据的大同小异,LLM之间也愈发的缺乏差异化,导致评测模型困难。目前用来比较模型能力的主流基准是斯坦福的HELM排行榜与Hugging Face的LLM Benchamark,但用户似乎喜欢用更主观的评测法:共鸣。

除了LLM的氛围令人兴奋以外,包括微软在内的研究人员一直在探索小语言模型的可能性,他们发现用高度专业化的数据集训练过的模型可以与规模大 50 倍的竞争对手相媲美。

微软发现,如果用非常专业且经过仔细挑选的数据集来训练的话,小语言模型也能与规模大50倍的模型匹敌。

如果 Epoch AI 的团队是正确的话,这项工作可能会变得更加紧迫。他们预测,我们将面临高质量语言数据库存货在未来“两年”内耗尽的风险,这导致实验室要探索训练数据的替代来源。

有研究团队认为,人类生成的数据快要用完了,低质量的语言数据估计在2030年到2050年间用完,而高质量语言数据汇总2026年用完,视觉数据会在2030至2060年间用完。

从更高层面去研究现状——尽管最近几年中逐年减弱,但美国的领先地位依旧,且绝大多数高引用论文仍然来自少数的美国机构。

中国站人工智能研究领域排名第二


产业


所有这些工作意味着现在是进入硬件业务的好时机,特别是如果你是 NVIDIA 的话。 GPU 需求把他们推进了市值万亿美元俱乐部,其芯片在人工智能研究当中的使用量是“其他替代方案总和”的 19 倍。

人工智能研究主要使用英伟达的芯片。注意:y轴的刻度是指数变化

虽然 NVIDIA 仍在不断推出新芯片,但他们旧的 GPU 却展现出了非凡的生命周期价值。 2017 年发布的 V100 是 2022 年人工智能研究论文当中最受欢迎的 GPU。这款CPU可能会在 5 年内停止使用,这意味着它已经服役了 10 年。

英伟达的V100芯片展现出强大的生命力

我们已经看到对 NVIDIA H100 的需求在快速增长,实验室急于构建大型的算力集群——可能还会有更多集群正在建设中。不过,我们听说这些建设项目并不是没有遇到重大的工程挑战。

用英伟达最新GPU H100组建的人工智能算力集群,最大的谷歌A3用了26000块GPU

“芯片大战”也迫使行业做出调整,NVIDIA、英特尔以及 AMD 都在为自身庞大的中国客户群打造特殊的、符合制裁规定的芯片。

这张图里面有些芯片又被美国纳入管制清单了

也许是有史以来最不出奇的消息是这个:Chat-GPT 是有史以来增长最快的互联网产品之一。它在开发者当中特别受欢迎,已经取代了 Stack Overflow——成为开发者在编码问题遇事不决时寻找解决方案的新去处。

ChatGPT的兴起与Stack Overflow的衰落形成了鲜明对比

但根据红杉资本的数据,目前有理由怀疑生成式人工智能产品的持久力——从图像生成到人工智能伴侣,各种产品的留存率都不稳定。

普通大众对人工智能产品似乎是一时兴起

除了消费软件领域以外,有迹象表明生成式人工智能可以加速实体人工智能领域的进步。 Wayve GAIA-1 展现出了令人印象深刻的通用性,可以作为训练和验证自动驾驶模型的强大工具。

GAIA-1利用视频、文本以及行动输入来生成逼真的驾驶场景,从而训练人工智能应对一些极端情况

除了生成式人工智能以外,我们还看到了此前一直在努力给人工智能寻找合适应用的行业有了重大举措。许多传统制药公司已经把宝全部押在人工智能上,与 Exscientia 以及 InstaDeep 等公司达成了价值数十亿美元的交易。

主流制药公司开始全力投入到人工智能辅助药物研发上

随着军队急于实现力量的现代化来应对不对称战争,人工智能优先的国防市场正在蓬勃发展。不过,新技术与老牌企业之间的冲突令新进入者难以立足。

去年美国防务初创企业的融资额为24亿美元

除了这些成功之外,风投行业的重心放在了生成式人工智能上面,这个板块撑起了 Atlas 等科技私募市场的一片天空。如果不是因为生成式人工智能的市场繁荣,人工智能的投资将比去年下降 40%。

全球最人工智能方面的投资相对稳定,而生成式人工智能成为投资新宠

那篇首次介绍 Transformer 神经网络的论文作者就是活生生的证明——仅 2023 年,Transformer 帮就获得了数十亿美元的融资。

《注意力就是你的全部所需》的作者后来均从谷歌出走创业,并且总共获得了数十亿美元的融资

百度在硅谷的人工智能实验室DeepSpeech2团队也是如此。他们在语音识别深度学习方面的工作向我们展示了现在支撑大规模人工智能的扩充定律。这支团队的大部分成员后来成为了领先的机器学习公司的创始人或高级管理人员。

百度硅谷人工智能实验室的早期工作证明了规模取胜之道

许多最引人注目的重磅融资根本就不是由传统风投公司领投的。 2023 年是企业风投年,大型科技公司有效利用了自己手头的战争基金。

风投的主力变成了科技巨头


政治


毫不奇怪,数十亿美元的投资,再加上能力的巨大飞跃,已经让政策制定者把人工智能放在了议程的首要位置。频谱的范围从从宽松到严管,全球对待监管有几种做法。

从宽松到严管,从利用已有法律框架到制定针对政策,各国对监管人工智能的态度不一

关于对人工智能的全球治理已经有不少潜在提案,提出者主要是一系列的全球组织。由 Matt Clifford 等人组织的英国人工智能安全峰会可能有助于将其中的一些想法具体化。

人工智能的全球治理仍处在早期阶段

随着我们不断看到人工智能在战场上的威力,这些争论议题可能会变得更加紧迫。乌克兰冲突已成为人工智能战争的实验室,展示了即便是相对临时拼凑的系统,如果巧妙地集成起来的话,也可以产生毁灭性的效果。

乌克兰成为了人工智能战争的试验场

另一个潜在的爆发点是明年的美国总统大选。到目前为止,与过去那种虚假信息相比,深度伪造以及其他人工智能生成内容发挥的作用还相对有限。但低成本、高质量的模型可能会改变这一点,从而促使采取先发制人的行动。

人工智能很有可能被用来干预大选

之前的人工智能现状报告曾经发出过警告,大型实验室也许忽视了人工智能的安全性。 2023 年大家都在争论人类是否会因为人工智能而存在生存风险,研究人员之间就开源与闭源的争论愈演愈烈,灭绝风险成为头条新闻。

随着人工智能展现出惊人的能力,部分专家开始担心起人类的生存风险

……不用说,虽然不是所有人都同意——但杨立昆(Yann LeCun) 和 马克·安德(Marc Andreessen)是主要的怀疑论者。

关于灭绝风险,专家分成了两个阵营

政策制定者现在才对人工智能的潜在风险感到震惊,这一点并不奇怪,虽然他们一直在努力了解相关知识。英国率先成立了一个专门的前沿人工智能工作组(Frontier AI Taskforce),由 Ian Hogarth 领导,美国也启动了国会调查。

各国政府纷纷开始关注人工智能

尽管仍存在理论争端,但实验室已经开始采取行动,就缓和开发部署的极端风险而言,Google DeepMind 与 Anthropic 是最早用更详细手段阐述了相关做法的公司之一。

大型实验室已经开始采取行动缓和风险

即使没有涉及到遥远的未来,大家也开始对诸如基于人类反馈的强化学习(这是Chat-GPT等技术的基础)等技术提出了棘手的问题。

基于人类反馈的强化学习面临一些根本性的挑战


预测


跟以往一样,本着透明的精神,我们对去年的预测打理一下分数——我们的得分是5/9。

✅ LLM 训练、生成式人工智能/音频、科技巨头全力投入通用人工智能的研发、对齐的投资,以及训练数据。

❌ 多模态研究、生物安全实验室监管以及半成品初创企业的厄运。

以下是我们对未来 12 个月的 10 个预测!其中涵括了:

- 生成式人工智能/电影制作

- 人工智能与选举

- 自我改善代理

- IPO的回归

- 价值超过 10 亿美元的模型

- 竞争调查

- 全球治理

- 银行 + GPU

- 音乐

- 芯片收购

  1. 好莱坞级的制作将运用生成式人工智能制作视觉特效
  2. 会有一家生成式人工智能媒体公司因为在2024美国大选中滥用生成技术而被调查
  3. 自我改善的人工智能代理在复杂环境(如AAA游戏、工具使用、科学等)下的表现将碾压最新技术
  4. 科技IPO市场将解冻,至少将会有一家聚焦人工智能的公司上市(如Databricks)
  5. 生成式人工智能的大模型训练成本可能飙升至10亿美元以上
  6. 美国的FTC或英国的UMA将对微软/OpenAI的交易发起竞争调查
  7. 除了志愿行为以外,全球人工智能治理将会取得有限进展
  8. 金融机构将取代风投股权资本,推出GPT债务基金来为算力融资
  9. 人工智能生成的歌曲将打入Billboard十大金曲排行榜或者Spotify Hits 2024
  10. 随着推理负载与成本飙升,会有一家大型人工智能公司(如OpenAI)收购一家面向推理的人工智能芯片公司