Simon Willison 分析了 Claude Code 新推出的 AI 驱动权限自动模式,强调了其对 Sonnet 4.6 分类器的使用,同时也批评了其非确定性的安全方法。
📝 详细摘要
本文探讨了 Claude Code 中“自动模式”的引入,该功能用基于 AI 的分类器取代了手动权限提示。该系统利用 Claude Sonnet 4.6,根据用户意图和预定义的安全规则来评估操作。Willison 详细介绍了默认的允许/阻止列表,例如允许项目范围内的本地操作,同时标记破坏性的 Git 命令。然而,他对非确定性 AI 在安全性方面的可靠性表示严重怀疑,认为确定性沙箱仍然是防止提示词注入和供应链攻击的更优方法。
💡 主要观点
- Claude Code 的自动模式采用专用的 Sonnet 4.6 分类器来自动化权限决策。 该辅助模型监控主会话的操作,以确保它们符合用户意图,且不会提升权限范围或针对不受信任的基础设施。
pip install -r requirements.txt 之类的命令,系统可能会无意中允许安装外部文件中遇到的恶意未锁定依赖项。
💬 文章金句
- 今天,我们推出了自动模式,这是 Claude Code 中的一种新权限模式,Claude 会代表您做出权限决策,并有安全防护措施在操作运行前进行监控。
- 我仍然不相信依赖 AI 的提示词注入防护,因为它们本质上是非确定性的。
- 我仍然希望我的编码智能体默认在强大的沙箱中运行,这种沙箱以确定性的方式限制文件访问和网络连接。
📊 文章信息
AI 评分:88
来源:Simon Willison's Weblog
作者:Simon Willison
分类:人工智能
语言:英文
阅读时间:3 分钟
字数:680
标签: Claude Code, AI 智能体, LLM 安全, Sonnet 4.6, 软件工程