Claude Code 的自动模式

📌 一句话摘要

Simon Willison 分析了 Claude Code 新推出的 AI 驱动权限自动模式，强调了其对 Sonnet 4.6 分类器的使用，同时也批评了其非确定性的安全方法。

📝 详细摘要

本文探讨了 Claude Code 中“自动模式”的引入，该功能用基于 AI 的分类器取代了手动权限提示。该系统利用 Claude Sonnet 4.6，根据用户意图和预定义的安全规则来评估操作。Willison 详细介绍了默认的允许/阻止列表，例如允许项目范围内的本地操作，同时标记破坏性的 Git 命令。然而，他对非确定性 AI 在安全性方面的可靠性表示严重怀疑，认为确定性沙箱仍然是防止提示词注入和供应链攻击的更优方法。

💡 主要观点

- Claude Code 的自动模式采用专用的 Sonnet 4.6 分类器来自动化权限决策。 该辅助模型监控主会话的操作，以确保它们符合用户意图，且不会提升权限范围或针对不受信任的基础设施。

该系统包含用于允许或阻止特定开发者操作的细粒度默认规则。 它允许标准的本地操作和只读 API 调用，但将破坏性的 Git 命令和外部代码执行标记为“软拒绝”（soft_deny），以防止意外或恶意的损害。

基于 AI 的安全措施本质上是非确定性的，可能不可靠。 作者认为，基于提示词的保护措施不如传统的确定性沙箱值得信赖，后者严格限制文件和网络访问。

当前的过滤器可能仍会让用户面临供应链攻击的风险。 通过允许诸如 pip install -r requirements.txt 之类的命令，系统可能会无意中允许安装外部文件中遇到的恶意未锁定依赖项。

💬 文章金句

- 今天，我们推出了自动模式，这是 Claude Code 中的一种新权限模式，Claude 会代表您做出权限决策，并有安全防护措施在操作运行前进行监控。

我仍然不相信依赖 AI 的提示词注入防护，因为它们本质上是非确定性的。
我仍然希望我的编码智能体默认在强大的沙箱中运行，这种沙箱以确定性的方式限制文件访问和网络连接。

📊 文章信息

AI 评分：88

来源：Simon Willison's Weblog

作者：Simon Willison

分类：人工智能

语言：英文

阅读时间：3 分钟

字数：680

标签： Claude Code, AI 智能体, LLM 安全, Sonnet 4.6, 软件工程

阅读完整文章

Claude Code 的自动模式

🤖 問 AI