Anthropic 发布最强模型 Claude Mythos,因其具备自主发现并利用「零日漏洞」的恐怖网络安全风险而宣布不对公众开放。
📝 详细摘要
Anthropic 近期发布了其性能最强的模型 Claude Mythos,但出于安全考虑限制公开发布。该模型在网络安全领域展现出「涌现」出的质变能力:它不仅能通过推理发现存在数十年之久的系统底层漏洞(如 OpenBSD 和 FFmpeg),还能自主编写攻击代码并进行针对性实验。Anthropic 警告称,Mythos 的出现意味着过去依赖「人力成本」维持的安全范式已失效。为此,公司发起了 Project Glasswing 计划,优先协助防御方修复漏洞,试图在 AI 攻防战中抢占先机。
💡 主要观点
- Claude Mythos 展现了前所未有的自主网络攻击能力。 该模型能自主发现主流操作系统和浏览器中的零日漏洞,并编写攻击代码,其漏洞利用成功率较前代模型呈指数级增长。
💬 文章金句
- Mythos Preview 能找到每一个主流操作系统和每一个主流浏览器中的「零日漏洞」级别的 bug,并自主编写攻击代码。
- 这些能力不是专门训练的结果,而是模型在代码、推理和自主性方面的通用改进的副产品——它们是「涌现」的。
- 「这个模型强大到连我们自己都害怕」,这句话既是警告,也是广告。
- 过去它们「安全」是因为攻击者需要大量的人力和时间来发现和利用漏洞,现在一个模型几小时就能完成同样的工作。
📊 文章信息
AI 评分:88
来源:爱范儿
作者:Selina
分类:人工智能
语言:中文
阅读时间:10 分钟
字数:2499
标签: Anthropic, Claude Mythos, 网络安全, 零日漏洞, AI 安全