全部 未讀 (21615) ★ 收藏 (0) 🤖 人工智能 (11168) 📊 商业科技 (4461) 💻 软件编程 (1685) 📁 个人成长 (1605) 📁 生活文化 (857) 📁 媒体资讯 (827) 📁 投资财经 (529) 🎨 产品设计 (408) 📁 AI 产品 (39) 📁 体育运动 (28)
篩選中: 🏷️ 轨迹评测 共 1 篇 ✕ 清除篩選
21617
全部文章
21615
未讀
204
今日新增
0
收藏
📡 Poller 最後抓取: 31 分鐘前 (06-08 20:00)
BestBlogs 精選 (21582)

🏷️ 熱門標籤

AI Agent 2157 AI 编程 985 Anthropic 981 Claude Code 916 AI 智能体 780 OpenAI 745 LLM 674 开源 574 OpenClaw 557 Claude 557 AI 517 AI 安全 490 开发者工具 432 Codex 416 软件工程 398 具身智能 334 Agent 334 个人成长 331 GitHub 321 生产力 315
Agent 该怎么做真正的安全评测?
📌 一句话摘要 本文介绍了上海人工智能实验室提出的 ATBench 系列基准,将 Agent 安全评测从单轮问答推进到多步执行轨迹和具体运行时环境(OpenClaw/CodeX),强调可诊断性。 📝 详细摘要 本文详细解读了上海人工智能实验室在 Agent 安全评测领域的最新研究成果,核心是 A
📅 2026-05-28 19:14 (11 天前) AI科技评论 人工智能 2 分鐘 ★ 86
Agent 安全 ATBench 轨迹评测 OpenClaw