JanLeike：OpenAI将如何在4年内实现超级对齐？

转载

1014 天前

8811

AI之势

文章转载来源：AI之势

作者：Daniel Filan@AXRP

推荐人：Cage 编译：wenli、彦希排版：Mengxi，Scout

OpenAI 在上个月初公布了自己的“超级对齐(Superalignment）” 计划，同时宣布将一次性拿出总算力中的 20% 投入到这个新方向中。OpenAI 的联创和首席科学家 Ilya Sutskever 和原对齐团队负责人Jan Leike 将共同领导这个新项目，目标是在 4 年时间内解决超级智能对齐的核心技术挑战，以保证人类对超级智能的可控。

为了实现这一点，OpenAI 需要先训练一个“和人类水平齐平的自动化对齐器”，再借由这个“自动对齐器”来实现和超级智能的对齐，根据 Introducing Superalignment 这篇文章，“自动对齐器”的设计中还涉及到实现让 AI 评估并监督 AI、基于可解释性对系统进行安全性验证、以及利用未对齐模型对系统进行扰动测试等。

本文为 Jan Leike 的访谈编译，是 Jan Leike 对于 OpenAI 要如何实现“超级对齐”的更为详细的技术思考。

以下为本文目录，建议结合要点进行针对性阅读。

关键词：

来源：AI之势

发布人：暖色

声明：该文观点仅代表作者本人，不代表火讯财经立场。火讯财经系信息发布平台，仅提供信息存储空间服务。

如文章涉及侵权，请及时致函告之，本站将第⼀时间删除⽂章。邮箱：840034348@qq.com

上一篇：公募也用上AI来炒股了？

下一篇：李国飞：繁荣越令人沉醉，危机往往埋得越深|《1929》推荐序

暖色

18256篇

文章总数

124631801

浏览数

新闻排行

李国飞：繁荣越令人沉醉，危机往往埋得越深|《1929》推荐序

RWA研究院携手Conflux，共探2026香港Web3嘉年华新范式

田涛对话马拉比：在AI浪潮中破解“上帝密码”与人类命运

数字人民币2.0全景：从16.7万亿交易额之后的制度化跃迁

催生万亿新资产：AI代理如何拥有、赚取和交易

250亿美元RWA市场背后的政策红线：42号文的“境内严禁”到底划在哪？

GPT-5.4与百万token时代：上市公司的AI转型窗口还剩多久

美国资本重注拉美：赌的不是增长，是金融体系的"关键节点"

JanLeike：OpenAI将如何在4年内实现超级对齐？

18256篇

124631801

新闻排行

友情链接：