本文从模型能力、成本、生图、Computer Use、插件、App 体验等维度,分析 Codex 正从 AI 编程工具进化为面向开发者和非开发者的 AI 工作台。
📝 详细摘要
文章基于作者 2 个月从 Cursor 切换到 Codex 的亲身实践,从 7 个维度总结 Codex 的产品进化:GPT-5.5 在 Terminal-Bench、OSWorld 等基准上领先竞品;Codex 的额度消耗比 Claude Code 慢 3-4 倍且价格更低;Image2 模型的中文文字渲染和排版能力突出,且随会员免费使用;GPT-5.4 的原生 Computer Use 能力在后台运行,不抢占鼠标键盘;内置 62 个应用和 110 个技能;App 端支持多 Agent 并行且一体化体验优于 Claude 的拆分设计;支持手机 ChatGPT 远程控制 Mac 端 Codex。作者也指出 Codex 的文字能力偏「理工直男」是最大短板。
💡 主要观点
- Codex 在复杂命令行工作流基准上显著领先竞品。 GPT-5.5 在 Terminal-Bench 2.0 达 82.7%,高于 Claude Opus 4.7 的 69.4% 和 Gemini 3.1 Pro 的 68.5%,体现其在规划、迭代与工具协同上的优势。
💬 文章金句
- Codex 我感觉最大短板就是文字能力,太。。。理工直男了!
- 1 年多前我给 Trae 提过建议:做普通人的工作台。今天,Codex 要实现这个目标了!
📊 文章信息
AI 初评:82
来源:AI产品黄叔
作者:AI产品黄叔
分类:人工智能
语言:中文
阅读时间:4 分钟
字数:964
标签: AI 编程, AI 产品与应用, LLM, AI Agent, 开发者工具