蚂蚁集团联合清华、北大等五所高校推出智能体安全评测平台 Agent3σ,从七大风险维度、三级评测体系全面评估 AI Agent 在真实环境中的安全风险。
📝 详细摘要
文章介绍了蚂蚁集团联合清华大学、北京大学、浙江大学、南京大学、杭州电子科技大学共同推出的智能体安全评测平台 Agent3σ。该平台针对 AI Agent 在调用工具、操控系统、执行真实业务时可能产生的安全风险,构建了多层次、可复现、贴近生产环境的安全评测能力。平台覆盖七大风险维度(本地环境破坏、数据信息安全、持久状态污染、权限管控、网络攻击、业务滥用、金融交易)和 30+ 典型场景,并设计了三级递进式评测体系:L1 静态数据评测(Sweep)、L2 仿真交互评测(Stage)、L3 真实环境评测(Canary)。首批榜单显示,Claude Opus 4.6 和 Qwen3.6-Plus 在多层次评测中表现突出,而部分模型在静态样本上表现尚可,进入仿真或真实环境后明显下滑,验证了多层次评测的必要性。项目已开源,旨在为模型厂商、应用开发者和监管合规提供安全基线。
💡 主要观点
- Agent 安全风险从模型输出合规扩展到执行链路安全。 传统大模型安全评测关注输出合规,但 Agent 的核心风险在于读取环境、规划任务、调用工具并对外部世界产生实际影响,需要系统级风险评测。
💬 文章金句
- 当智能体真正接入网页、邮件、文件、API 与业务系统后,安全风险也不再只是模型'说错话',而是可能演变为 Agent '做错事'。
- Agent3σ 的评测视角因此从单点问答升级为系统级风险评测。
- Agent3σ 的发布,推动 AI Agent 安全评测从单一 Prompt 攻防,进入全任务链路可观测、可量化、可比较的新阶段。
📊 文章信息
AI 初评:85
来源:蚂蚁技术 AntTech
作者:蚂蚁技术 AntTech
分类:人工智能
语言:中文
阅读时间:9 分钟
字数:2032
标签: AI Agent, 智能体安全, 安全评测, Agent3σ, 蚂蚁集团