三个理由说明为何 Anthropic 的 Claude Mythos 发布被过度炒作了

📌 一句话摘要

Gary Marcus 认为 Anthropic 对 Claude Mythos 的发布存在过度炒作，并指出了其测试环境简化、开源模型性能相当以及基准测试仅为渐进式提升等问题。

📝 详细摘要

在这篇评论中，Gary Marcus 剖析了围绕 Anthropic “Mythos” 模型发布的炒作。他提出了三个主要的反对观点：首先，网络安全演示（如 Firefox 漏洞利用）是在禁用了沙盒的模拟环境中进行的，这使其更像是概念验证而非即时的现实威胁。其次，他指出，当给定隔离代码时，更小、更便宜的开源权重模型也可以复制大部分相同的漏洞分析。最后，他指出 Mythos 在有效计算指数（ECI）上的表现代表了遵循现有趋势的渐进式改进，而非突破性的加速。Marcus 总结道，虽然此次发布凸显了加强监管的必要性，但媒体叙事夸大了其带来的即时危险。

💡 主要观点

- Mythos 展示的网络安全威胁因简化的测试条件而被夸大了。 Firefox 漏洞利用演示依赖于先前模型的研究，并且是在关闭沙盒的情况下执行的，这并不能反映现实世界中的安全障碍。

开源权重模型可以在漏洞分析中取得类似的结果。 测试表明，当漏洞被隔离时，小型且具有成本效益的开源模型可以恢复大部分相同的分析结果，这表明 Mythos 在这方面并非具有独特的能力。

Mythos 代表的是渐进式进步，而非计算效率方面的范式转移。 当根据 Epoch AI 的 ECI 等行业指标进行归一化处理时，Mythos 遵循了既定的趋势线，仅略高于 GPT-5.4，并未显示出突破性的加速。

💬 文章金句

- 实际测试的系统被赋予了比现实生活中简单得多的任务，且关闭了‘沙盒’，这使其更像是一个概念验证，而非即时的威胁。

Mythos 虽然更先进，但可能并不像所描绘的那样遥遥领先。
Mythos 基本处于趋势线上，只是略高于 GPT 5.4。
这次演示无疑是一个概念验证，表明我们需要理顺监管和技术方面的事务，但它并非媒体和公众所认为的那种即时威胁。

📊 文章信息

AI 评分：84

来源：Marcus on AI

作者：Gary Marcus

分类：人工智能

语言：英文

阅读时间：2 分钟

字数：309

标签： Claude Mythos, Anthropic, AI 安全, 网络安全, 模型评估

阅读完整文章

三个理由说明为何 Anthropic 的 Claude Mythos 发布被过度炒作了

🤖 問 AI