← 回總覽

微软推出 MDASH,用于大规模 AI 漏洞研究

📅 2026-06-05 14:30 InfoQ 中文 人工智能 2 分鐘 1253 字 評分: 82
AI 安全 LLM AI Agent 漏洞发现 微软
📌 一句话摘要 微软推出多模型代理安全平台 MDASH,整合 100 多个专业 AI 代理,用于对 Windows 等大型代码库进行自动化漏洞审计,在基准测试中取得 88.45% 的得分。 📝 详细摘要 本文报道了微软推出的 AI 驱动漏洞发现系统 MDASH。该系统是一个多模型代理安全平台,整合了 100 多个专业 AI 代理,通过扫描、辩论、验证、去重和利用等专门阶段协同工作,对 Windows、Hyper-V 和 Azure 等大型专有代码库进行自动化安全审计。在包含 1507 个真实世界漏洞的公开 CyberGym 基准测试中,MDASH 取得了 88.45% 的得分,比第二名高出

📌 一句话摘要

微软推出多模型代理安全平台 MDASH,整合 100 多个专业 AI 代理,用于对 Windows 等大型代码库进行自动化漏洞审计,在基准测试中取得 88.45% 的得分。

📝 详细摘要

本文报道了微软推出的 AI 驱动漏洞发现系统 MDASH。该系统是一个多模型代理安全平台,整合了 100 多个专业 AI 代理,通过扫描、辩论、验证、去重和利用等专门阶段协同工作,对 Windows、Hyper-V 和 Azure 等大型专有代码库进行自动化安全审计。在包含 1507 个真实世界漏洞的公开 CyberGym 基准测试中,MDASH 取得了 88.45% 的得分,比第二名高出约 5 个百分点。文章还引用了业界对大规模自主安全系统运营风险的讨论,指出治理层必须在代理投入运行前设计好。目前 MDASH 正由微软安全团队进行内部测试,并通过有限私有预览向部分客户开放。

💡 主要观点

- MDASH 通过多代理协作架构实现大规模代码审计。 系统整合 100 多个专业 AI 代理,分别负责扫描、辩论、验证、去重和利用等阶段,实现跨文件推理和实际可利用漏洞的验证。

MDASH 在基准测试中表现优于现有系统。 在 CyberGym 基准测试中取得 88.45% 的得分,比第二名高出约 5 个百分点;内部测试中对历史漏洞的召回率达到 96%-100%。
系统设计不依赖特定模型,强调协调层的重要性。 微软强调,未来的 AI 安全工具将更依赖于围绕模型构建的协调系统,而非模型本身的原始能力,这使得团队可以灵活更换或升级模型。
大规模自主安全系统引发运营风险讨论。 业界人士指出,当专用代理协调多个系统时,权限边界的配置错误可能引发连锁反应,治理层必须在代理投入运行前设计好。

💬 文章金句

- 协调层正是让事情变得引人入胜同时又充满风险的地方。当专用代理开始协调身份系统、财务监控和云基础设施时,一个权限边界的配置错误所引发的连锁反应能够波及的范围将变得极其巨大。

📊 文章信息

AI 初评:82

来源:InfoQ 中文

作者:InfoQ 中文

分类:人工智能

语言:中文

阅读时间:5 分钟

字数:1151

标签: AI 安全, LLM, AI Agent, 漏洞发现, 微软

阅读完整文章

查看原文 → 發佈: 2026-06-05 14:30:00 收錄: 2026-06-06 02:00:10

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。