← 回總覽

Claude Code 的自动模式

📅 2026-03-25 07:57 Simon Willison 人工智能 1 分鐘 1233 字 評分: 88
Claude Code AI 智能体 LLM 安全 Sonnet 4.6 软件工程
📌 一句话摘要 Simon Willison 分析了 Claude Code 新推出的 AI 驱动权限自动模式,强调了其对 Sonnet 4.6 分类器的使用,同时也批评了其非确定性的安全方法。 📝 详细摘要 本文探讨了 Claude Code 中“自动模式”的引入,该功能用基于 AI 的分类器取代了手动权限提示。该系统利用 Claude Sonnet 4.6,根据用户意图和预定义的安全规则来评估操作。Willison 详细介绍了默认的允许/阻止列表,例如允许项目范围内的本地操作,同时标记破坏性的 Git 命令。然而,他对非确定性 AI 在安全性方面的可靠性表示严重怀疑,认为确定性沙箱仍然

📌 一句话摘要

Simon Willison 分析了 Claude Code 新推出的 AI 驱动权限自动模式,强调了其对 Sonnet 4.6 分类器的使用,同时也批评了其非确定性的安全方法。

📝 详细摘要

本文探讨了 Claude Code 中“自动模式”的引入,该功能用基于 AI 的分类器取代了手动权限提示。该系统利用 Claude Sonnet 4.6,根据用户意图和预定义的安全规则来评估操作。Willison 详细介绍了默认的允许/阻止列表,例如允许项目范围内的本地操作,同时标记破坏性的 Git 命令。然而,他对非确定性 AI 在安全性方面的可靠性表示严重怀疑,认为确定性沙箱仍然是防止提示词注入和供应链攻击的更优方法。

💡 主要观点

- Claude Code 的自动模式采用专用的 Sonnet 4.6 分类器来自动化权限决策。 该辅助模型监控主会话的操作,以确保它们符合用户意图,且不会提升权限范围或针对不受信任的基础设施。

该系统包含用于允许或阻止特定开发者操作的细粒度默认规则。 它允许标准的本地操作和只读 API 调用,但将破坏性的 Git 命令和外部代码执行标记为“软拒绝”(soft_deny),以防止意外或恶意的损害。
基于 AI 的安全措施本质上是非确定性的,可能不可靠。 作者认为,基于提示词的保护措施不如传统的确定性沙箱值得信赖,后者严格限制文件和网络访问。
当前的过滤器可能仍会让用户面临供应链攻击的风险。 通过允许诸如 pip install -r requirements.txt 之类的命令,系统可能会无意中允许安装外部文件中遇到的恶意未锁定依赖项。

💬 文章金句

- 今天,我们推出了自动模式,这是 Claude Code 中的一种新权限模式,Claude 会代表您做出权限决策,并有安全防护措施在操作运行前进行监控。

  • 我仍然不相信依赖 AI 的提示词注入防护,因为它们本质上是非确定性的。
  • 我仍然希望我的编码智能体默认在强大的沙箱中运行,这种沙箱以确定性的方式限制文件访问和网络连接。

📊 文章信息

AI 评分:88

来源:Simon Willison's Weblog

作者:Simon Willison

分类:人工智能

语言:英文

阅读时间:3 分钟

字数:680

标签: Claude Code, AI 智能体, LLM 安全, Sonnet 4.6, 软件工程

阅读完整文章

查看原文 → 發佈: 2026-03-25 07:57:33 收錄: 2026-03-25 10:00:14

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。