Anthropic 官方发布事后复盘报告,承认 Claude Code 因三个 Bug(推理强度调整、缓存清理 Bug、系统提示词变更)导致用户体验下降,但强调模型本身能力未退化。
📝 详细摘要
本文报道了 Anthropic 针对用户反馈 Claude Code「降智」问题发布的官方复盘报告。报告指出,问题并非模型能力退化,而是由 Claude Code 和 Agent SDK 运行框架中的三个 Bug 导致:一是将默认推理强度从 high 调整为 medium,牺牲了智能以换取速度;二是缓存清理逻辑出现 Bug,导致模型在每轮对话中持续失忆;三是系统提示词中加入的「降低冗长度」指令限制了模型思考深度。Anthropic 已逐一修复这些问题,并宣布将重置所有订阅用户的使用限额作为歉意。文章还介绍了 Anthropic 后续的改进措施,包括让内部员工使用公共版本、强化系统提示词评估流程、引入更长的灰度发布观察期等。
💡 主要观点
- Claude Code 体验下降由三个框架层 Bug 导致,模型本身未退化。 Anthropic 调查确认,问题源于 Claude Code 和 Agent SDK 运行框架的改动,而非模型能力退化。Claude API 未受影响。
💬 文章金句
- 在过去一个月里,一些用户反馈 Claude Code 的质量有所下降。我们对此进行了调查,并发布了一份事后复盘报告,总结了发现的三个问题。
- 模型本身并没有出现能力退化,Claude API 也未受到影响。
- 这些改动分别在不同时间、作用于不同用户流量切片,叠加起来的整体效果表现为「广泛且不一致」的性能下降。
📊 文章信息
AI 初评:86
来源:机器之心
作者:机器之心
分类:人工智能
语言:中文
阅读时间:8 分钟
字数:1803
标签: Anthropic, Claude Code, 降智, Bug 复盘, AI 编程