← 回總覽

Anthropic 的「奥本海默时刻」:最害怕 AI 的公司,正在造最危险的 AI

📅 2026-04-11 00:29 Selina 人工智能 1 分鐘 1214 字 評分: 88
Anthropic Claude Mythos 网络安全 零日漏洞 AI 安全
📌 一句话摘要 Anthropic 发布最强模型 Claude Mythos,因其具备自主发现并利用「零日漏洞」的恐怖网络安全风险而宣布不对公众开放。 📝 详细摘要 Anthropic 近期发布了其性能最强的模型 Claude Mythos,但出于安全考虑限制公开发布。该模型在网络安全领域展现出「涌现」出的质变能力:它不仅能通过推理发现存在数十年之久的系统底层漏洞(如 OpenBSD 和 FFmpeg),还能自主编写攻击代码并进行针对性实验。Anthropic 警告称,Mythos 的出现意味着过去依赖「人力成本」维持的安全范式已失效。为此,公司发起了 Project Glasswing

📌 一句话摘要

Anthropic 发布最强模型 Claude Mythos,因其具备自主发现并利用「零日漏洞」的恐怖网络安全风险而宣布不对公众开放。

📝 详细摘要

Anthropic 近期发布了其性能最强的模型 Claude Mythos,但出于安全考虑限制公开发布。该模型在网络安全领域展现出「涌现」出的质变能力:它不仅能通过推理发现存在数十年之久的系统底层漏洞(如 OpenBSD 和 FFmpeg),还能自主编写攻击代码并进行针对性实验。Anthropic 警告称,Mythos 的出现意味着过去依赖「人力成本」维持的安全范式已失效。为此,公司发起了 Project Glasswing 计划,优先协助防御方修复漏洞,试图在 AI 攻防战中抢占先机。

💡 主要观点

- Claude Mythos 展现了前所未有的自主网络攻击能力。 该模型能自主发现主流操作系统和浏览器中的零日漏洞,并编写攻击代码,其漏洞利用成功率较前代模型呈指数级增长。

AI 的推理能力打破了传统安全工具和人工审计的局限。 不同于传统模糊测试的盲测,Mythos 能理解代码语义并进行逻辑推理,发现需要跨维度触发的复杂深层漏洞。
全球关键基础设施的安全范式面临根本性挑战。 许多运行在老旧代码上的系统过去因攻击成本高昂而相对安全,但 AI 的介入使大规模、低成本的自动化攻击成为可能。
Anthropic 采取「负责任披露」与「能力展示」并行的策略。 通过公开警告危险性,A 社既确立了安全权威地位,也通过「连自己都害怕」的宣传侧面证明了模型极高的性能上限。

💬 文章金句

- Mythos Preview 能找到每一个主流操作系统和每一个主流浏览器中的「零日漏洞」级别的 bug,并自主编写攻击代码。

  • 这些能力不是专门训练的结果,而是模型在代码、推理和自主性方面的通用改进的副产品——它们是「涌现」的。
  • 「这个模型强大到连我们自己都害怕」,这句话既是警告,也是广告。
  • 过去它们「安全」是因为攻击者需要大量的人力和时间来发现和利用漏洞,现在一个模型几小时就能完成同样的工作。

📊 文章信息

AI 评分:88

来源:爱范儿

作者:Selina

分类:人工智能

语言:中文

阅读时间:10 分钟

字数:2499

标签: Anthropic, Claude Mythos, 网络安全, 零日漏洞, AI 安全

阅读完整文章

查看原文 → 發佈: 2026-04-11 00:29:48 收錄: 2026-04-10 18:00:50

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。