Anthropic 的「奥本海默时刻」：最害怕 AI 的公司，正在造最危险的 AI

📌 一句话摘要

Anthropic 发布最强模型 Claude Mythos，因其具备自主发现并利用「零日漏洞」的恐怖网络安全风险而宣布不对公众开放。

📝 详细摘要

Anthropic 近期发布了其性能最强的模型 Claude Mythos，但出于安全考虑限制公开发布。该模型在网络安全领域展现出「涌现」出的质变能力：它不仅能通过推理发现存在数十年之久的系统底层漏洞（如 OpenBSD 和 FFmpeg），还能自主编写攻击代码并进行针对性实验。Anthropic 警告称，Mythos 的出现意味着过去依赖「人力成本」维持的安全范式已失效。为此，公司发起了 Project Glasswing 计划，优先协助防御方修复漏洞，试图在 AI 攻防战中抢占先机。

💡 主要观点

- Claude Mythos 展现了前所未有的自主网络攻击能力。 该模型能自主发现主流操作系统和浏览器中的零日漏洞，并编写攻击代码，其漏洞利用成功率较前代模型呈指数级增长。

AI 的推理能力打破了传统安全工具和人工审计的局限。 不同于传统模糊测试的盲测，Mythos 能理解代码语义并进行逻辑推理，发现需要跨维度触发的复杂深层漏洞。

全球关键基础设施的安全范式面临根本性挑战。 许多运行在老旧代码上的系统过去因攻击成本高昂而相对安全，但 AI 的介入使大规模、低成本的自动化攻击成为可能。

Anthropic 采取「负责任披露」与「能力展示」并行的策略。 通过公开警告危险性，A 社既确立了安全权威地位，也通过「连自己都害怕」的宣传侧面证明了模型极高的性能上限。

💬 文章金句

- Mythos Preview 能找到每一个主流操作系统和每一个主流浏览器中的「零日漏洞」级别的 bug，并自主编写攻击代码。

这些能力不是专门训练的结果，而是模型在代码、推理和自主性方面的通用改进的副产品——它们是「涌现」的。
「这个模型强大到连我们自己都害怕」，这句话既是警告，也是广告。
过去它们「安全」是因为攻击者需要大量的人力和时间来发现和利用漏洞，现在一个模型几小时就能完成同样的工作。

📊 文章信息

AI 评分：88

来源：爱范儿

作者：Selina

分类：人工智能

语言：中文

阅读时间：10 分钟

字数：2499

标签： Anthropic, Claude Mythos, 网络安全, 零日漏洞, AI 安全

阅读完整文章

Anthropic 的「奥本海默时刻」：最害怕 AI 的公司，正在造最危险的 AI

🤖 問 AI