← 回總覽

Anthropic 联创定下 deadline:2028 年 AI 实现自我进化,没有人类了

📅 2026-05-05 11:59 机器之心 人工智能 2 分鐘 1516 字 評分: 87
递归自我改进 AI 研发自动化 Anthropic Jack Clark AI 对齐
📌 一句话摘要 Anthropic 联合创始人 Jack Clark 基于公开数据判断,到 2028 年底 AI 实现递归自我改进的概率为 60%,AI 研究即将进入端到端自动化阶段。 📝 详细摘要 本文编译自 Anthropic 联合创始人 Jack Clark 的 Import AI 455 期 newsletter,系统阐述了他对 AI 递归自我改进(recursive self-improvement)即将到来的判断。Clark 通过分析 SWE-Bench、METR 任务时长、CORE-Bench、MLE-Bench、PostTrainBench、Kernel 设计等多个公开基准

📌 一句话摘要

Anthropic 联合创始人 Jack Clark 基于公开数据判断,到 2028 年底 AI 实现递归自我改进的概率为 60%,AI 研究即将进入端到端自动化阶段。

📝 详细摘要

本文编译自 Anthropic 联合创始人 Jack Clark 的 Import AI 455 期 newsletter,系统阐述了他对 AI 递归自我改进(recursive self-improvement)即将到来的判断。Clark 通过分析 SWE-Bench、METR 任务时长、CORE-Bench、MLE-Bench、PostTrainBench、Kernel 设计等多个公开基准的进展,论证了 AI 系统在编程能力、长时任务执行、科学复现、模型微调、底层优化等 AI 研发核心环节上的快速进步。他认为,到 2028 年底,出现无人类参与的 AI 研发的概率超过 60%,届时 AI 系统将能够自主构建自己的后继系统,开启自我迭代循环。文章还讨论了这一趋势带来的对齐挑战、经济结构变化和社会治理问题。

💡 主要观点

- Jack Clark 预测到 2028 年底 AI 实现递归自我改进的概率为 60%。 基于 SWE-Bench、METR、CORE-Bench、MLE-Bench 等多个公开基准的进展,AI 在编程、长时任务、科学复现等 AI 研发核心能力上进步显著,已接近端到端自动化研发的门槛。

AI 系统在编程能力和任务时间跨度上取得突破性进展。 SWE-Bench 成功率从 2023 年的 2% 提升至 2026 年的 93.9%;METR 数据显示 AI 可独立完成的任务时长从 2022 年的 30 秒增长到 2026 年的 12 小时,预计年底可达 100 小时。
AI 研发自动化将带来对齐、经济结构和社会治理等多重挑战。 递归自我改进可能导致对齐技术失效、误差累积;AI 驱动的资本密集型经济将改变就业结构;资源分配和治理问题将变得政治化。

💬 文章金句

- 到 2028 年底之前,出现无人类参与的 AI 研发的可能性已经相当高,或许超过 60%。

  • 如果这一刻真的到来,人类就像跨过了卢比孔河,进入一个几乎无法预测的未来。
  • AI 系统已经足够强,能够自动化 AI 研发中的一个重要组成部分,并显著加速所有参与 AI 研发的人类研究员和工程师。
  • 即便 AI 系统目前相对缺乏创造力,也有理由相信,它们仍然能够推动自身继续向前发展。
  • 你必须把对齐做好:如今有效的对齐技术可能会在递归式自我改进中失效,因为 AI 系统会变得比监督它们的人员或系统智能得多。

📊 文章信息

AI 初评:87

来源:机器之心

作者:机器之心

分类:人工智能

语言:中文

阅读时间:35 分钟

字数:8558

标签: 递归自我改进, AI 研发自动化, Anthropic, Jack Clark, AI 对齐

阅读完整文章

查看原文 → 發佈: 2026-05-05 11:59:00 收錄: 2026-05-05 20:00:53

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。