← 回總覽

Nature 重磅:AI 写的论文在顶会同行评审击败 55% 人类,单篇成本仅 15 美元

📅 2026-03-28 14:05 新智元 人工智能 1 分鐘 1138 字 評分: 88
AI Scientist Sakana AI Nature 同行评审 Scaling Law
📌 一句话摘要 Nature 报道了 Sakana AI 开发的全自动「AI 科学家」,该系统能以 15 美元的成本完成科研全流程,并在顶会评审中击败 55% 的人类作者。 📝 详细摘要 本文详细介绍了由 Sakana AI、牛津大学和 UBC 联合研发的「The AI Scientist」系统。该系统实现了从 Idea 生成、实验迭代、论文写作到自动评审的全链路自动化。在 ICLR 2025 某 workshop 的双盲评审中,AI 生成的论文获得了高于 55% 人类作者的评分。研究揭示了「科研 Scaling Law」,即论文质量随模型能力和推理算力的提升而显著增长。尽管目前仍存在引用

📌 一句话摘要

Nature 报道了 Sakana AI 开发的全自动「AI 科学家」,该系统能以 15 美元的成本完成科研全流程,并在顶会评审中击败 55% 的人类作者。

📝 详细摘要

本文详细介绍了由 Sakana AI、牛津大学和 UBC 联合研发的「The AI Scientist」系统。该系统实现了从 Idea 生成、实验迭代、论文写作到自动评审的全链路自动化。在 ICLR 2025 某 workshop 的双盲评审中,AI 生成的论文获得了高于 55% 人类作者的评分。研究揭示了「科研 Scaling Law」,即论文质量随模型能力和推理算力的提升而显著增长。尽管目前仍存在引用幻觉等局限,但其单篇 15 美元的极低成本和高效的智能体树搜索机制,预示着科学发现正进入工业化流水线时代。

💡 主要观点

- 全链路科研自动化:系统覆盖了从构思、实验、写作到评审的四大核心阶段。 AI 不再只是辅助工具,而是进化为能够独立定义问题、执行实验并完成学术表达的自主科研代理。

通过人类同行评审测试:AI 论文在顶会盲审中获得高分。 在 ICLR 2025 某 workshop 中,AI 论文得分超过 55% 的人类投稿,标志着学术评审正式迎来「图灵测试」时刻。
科研 Scaling Law 的显现:科学发现质量与算力及模型能力正相关。 研究证明,随着底层模型能力的增强和推理算力的投入,AI 产出的论文质量呈现指数级提升趋势。
极高的经济效能与工业化潜力:单篇论文成本仅 15 美元。 极低的成本意味着科研可以从单线程试错转变为大规模并行搜索,极大地加速科学进步的速度。

💬 文章金句

- AI 将永远改变科学发现和科研进步的方式。

  • 这标志着同行评审,真正迎来了「图灵测试」时刻。
  • 科研不再是单线程试错,而变成了一个可扩展的搜索过程。
  • 当 AI 开始独立做科学,谁来定义什么算科学。

📊 文章信息

AI 评分:88

来源:新智元

作者:新智元

分类:人工智能

语言:中文

阅读时间:13 分钟

字数:3053

标签: AI Scientist, Sakana AI, Nature, 同行评审, Scaling Law

阅读完整文章

查看原文 → 發佈: 2026-03-28 14:05:00 收錄: 2026-03-28 20:00:28

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。