← 回總覽

Codex 正在变成 AI 工作台

📅 2026-06-04 07:00 AI产品黄叔 人工智能 2 分鐘 1461 字 評分: 82
AI 编程 AI 产品与应用 LLM AI Agent 开发者工具
📌 一句话摘要 本文从模型能力、成本、生图、Computer Use、插件、App 体验等维度,分析 Codex 正从 AI 编程工具进化为面向开发者和非开发者的 AI 工作台。 📝 详细摘要 文章基于作者 2 个月从 Cursor 切换到 Codex 的亲身实践,从 7 个维度总结 Codex 的产品进化:GPT-5.5 在 Terminal-Bench、OSWorld 等基准上领先竞品;Codex 的额度消耗比 Claude Code 慢 3-4 倍且价格更低;Image2 模型的中文文字渲染和排版能力突出,且随会员免费使用;GPT-5.4 的原生 Computer Use 能力在后台

📌 一句话摘要

本文从模型能力、成本、生图、Computer Use、插件、App 体验等维度,分析 Codex 正从 AI 编程工具进化为面向开发者和非开发者的 AI 工作台。

📝 详细摘要

文章基于作者 2 个月从 Cursor 切换到 Codex 的亲身实践,从 7 个维度总结 Codex 的产品进化:GPT-5.5 在 Terminal-Bench、OSWorld 等基准上领先竞品;Codex 的额度消耗比 Claude Code 慢 3-4 倍且价格更低;Image2 模型的中文文字渲染和排版能力突出,且随会员免费使用;GPT-5.4 的原生 Computer Use 能力在后台运行,不抢占鼠标键盘;内置 62 个应用和 110 个技能;App 端支持多 Agent 并行且一体化体验优于 Claude 的拆分设计;支持手机 ChatGPT 远程控制 Mac 端 Codex。作者也指出 Codex 的文字能力偏「理工直男」是最大短板。

💡 主要观点

- Codex 在复杂命令行工作流基准上显著领先竞品。 GPT-5.5 在 Terminal-Bench 2.0 达 82.7%,高于 Claude Opus 4.7 的 69.4% 和 Gemini 3.1 Pro 的 68.5%,体现其在规划、迭代与工具协同上的优势。

Codex 的额度消耗远低于 Claude Code,性价比更高。 实测显示 Claude Code 消耗是 Codex 的 3-4 倍,且 Codex 的 20x 额度几乎用不完,渠道价格也低于 CC。
Image2 模型的中文文字渲染和排版能力突出,且免费随会员使用。 即使文字密集也能准确渲染,结构化排版能力强,最低 Plus 会员每 5 小时可生成十几张,而 CC 需额外接 API。
原生 Computer Use 能力在后台运行,不抢占鼠标键盘,已可商用。 GPT-5.5 在 OSWorld-Verified 达 78.7%,高于人类基准 72.4% 和 Claude Opus 4.7,速度更快、准确度可用。
Codex 最大短板是文字能力,偏「理工直男」。 作者指出 Codex 在文字表达上不够自然流畅,是当前产品体验的主要不足。

💬 文章金句

- Codex 我感觉最大短板就是文字能力,太。。。理工直男了!

  • 1 年多前我给 Trae 提过建议:做普通人的工作台。今天,Codex 要实现这个目标了!

📊 文章信息

AI 初评:82

来源:AI产品黄叔

作者:AI产品黄叔

分类:人工智能

语言:中文

阅读时间:4 分钟

字数:964

标签: AI 编程, AI 产品与应用, LLM, AI Agent, 开发者工具

阅读完整文章

查看原文 → 發佈: 2026-06-04 07:00:00 收錄: 2026-06-04 22:00:19

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。