Codex 正在变成 AI 工作台

📌 一句话摘要

本文从模型能力、成本、生图、Computer Use、插件、App 体验等维度，分析 Codex 正从 AI 编程工具进化为面向开发者和非开发者的 AI 工作台。

📝 详细摘要

文章基于作者 2 个月从 Cursor 切换到 Codex 的亲身实践，从 7 个维度总结 Codex 的产品进化：GPT-5.5 在 Terminal-Bench、OSWorld 等基准上领先竞品；Codex 的额度消耗比 Claude Code 慢 3-4 倍且价格更低；Image2 模型的中文文字渲染和排版能力突出，且随会员免费使用；GPT-5.4 的原生 Computer Use 能力在后台运行，不抢占鼠标键盘；内置 62 个应用和 110 个技能；App 端支持多 Agent 并行且一体化体验优于 Claude 的拆分设计；支持手机 ChatGPT 远程控制 Mac 端 Codex。作者也指出 Codex 的文字能力偏「理工直男」是最大短板。

💡 主要观点

- Codex 在复杂命令行工作流基准上显著领先竞品。 GPT-5.5 在 Terminal-Bench 2.0 达 82.7%，高于 Claude Opus 4.7 的 69.4% 和 Gemini 3.1 Pro 的 68.5%，体现其在规划、迭代与工具协同上的优势。

Codex 的额度消耗远低于 Claude Code，性价比更高。 实测显示 Claude Code 消耗是 Codex 的 3-4 倍，且 Codex 的 20x 额度几乎用不完，渠道价格也低于 CC。

Image2 模型的中文文字渲染和排版能力突出，且免费随会员使用。 即使文字密集也能准确渲染，结构化排版能力强，最低 Plus 会员每 5 小时可生成十几张，而 CC 需额外接 API。

原生 Computer Use 能力在后台运行，不抢占鼠标键盘，已可商用。 GPT-5.5 在 OSWorld-Verified 达 78.7%，高于人类基准 72.4% 和 Claude Opus 4.7，速度更快、准确度可用。

Codex 最大短板是文字能力，偏「理工直男」。 作者指出 Codex 在文字表达上不够自然流畅，是当前产品体验的主要不足。

💬 文章金句

- Codex 我感觉最大短板就是文字能力，太。。。理工直男了！

1 年多前我给 Trae 提过建议：做普通人的工作台。今天，Codex 要实现这个目标了！

📊 文章信息

AI 初评：82

来源：AI产品黄叔

作者：AI产品黄叔

分类：人工智能

语言：中文

阅读时间：4 分钟

字数：964

标签： AI 编程, AI 产品与应用, LLM, AI Agent, 开发者工具

阅读完整文章

Codex 正在变成 AI 工作台

🤖 問 AI