本文基于作者实测和社区反馈,批评 Claude Opus 4.7 在长上下文、表达能力和成本方面的倒退,认为其仅在多步 Agent 场景有优势,对其他场景是降级。
📝 详细摘要
文章对 Anthropic 新发布的 Claude Opus 4.7 模型进行了负面评测。作者结合自身使用体验和 Hacker News 等社区反馈,指出该版本存在多个严重问题:长上下文能力相比 4.6 版本严重倒退;因更换 tokenizer 导致实际使用成本显著增加,尽管官方宣称价格不变;默认隐藏思考过程,被社区戏称为“AI 摸鱼”;以及其标志性的“说人话”能力(自然语言表达)也出现退化。作者认为,Opus 4.7 的优化方向是服务于“写代码的 Agent”等长任务执行场景,但为此牺牲了通用场景的体验和稳定性,导致其对大多数用户而言是一次降级,并因此决定暂时搁置使用 Claude Code。
💡 主要观点
- Opus 4.7 在多项核心能力上出现倒退,尤其是长上下文和自然表达。 作者和海外社区均发现,其长上下文处理能力不如 4.6,且中英文的“说人话”能力退化,失去了 Claude 的传统优势。
💬 文章金句
- Claude 已经退化到,没法再被信任去干复杂工程了。
- 这就像你雇了个乙方,他来决定今天是‘思考日’还是‘靠感觉日’。
- Opus 4.7 是给‘写代码的 Agent’准备的升级。
- Opus 4.7 对‘其他所有场景’都是降级。
- ‘价格没变’是一次话术,实际上贵了不少。
📊 文章信息
AI 初评:81
来源:刘小排r
作者:刘小排
分类:人工智能
语言:中文
阅读时间:5 分钟
字数:1142
标签: Claude Opus, 模型评测, Anthropic, 大语言模型, AI 编程