Anthropic 发布 Claude Opus 4.8,在编程、智能体、推理、知识工作四个维度全面超越 Opus 4.7,诚实度提升四倍,并带来动态工作流、努力控制和实时指令更新三大新功能。
📝 详细摘要
该推文详细解读了 Anthropic 发布的 Claude Opus 4.8 旗舰模型。模型在编程、智能体、推理、知识工作四个维度的基准测试中全面超越 Opus 4.7,最显著的改进是「诚实度」——模型对自己有缺陷代码视而不见的概率降低了约四倍。同步推出的三个新功能包括:Claude Code 中的动态工作流(可启动数百个并行子智能体)、claude.ai 上的「努力控制」(可调思考深度)、以及 API 层面的实时指令更新。早期测试者反馈模型在判断力和可靠性上有明显改善,价格保持不变。
📊 文章信息
AI 初评:85
来源:ginobefun(@hongming731)
作者:ginobefun
分类:人工智能
语言:中文
阅读时间:3 分钟
字数:521
标签: Claude Opus 4.8, Anthropic, 模型升级, 诚实度, 动态工作流