OpenAI 全新 GPT-5.4-high 模型在 Code Arena 中跻身前 6,在 Web 开发领域展现出与 Gemini 3.1 Pro 相媲美的性能。
📝 详细摘要
LMArena(前身为 LMSYS)宣布,OpenAI 最新的 GPT-5.4-high 模型已成功进入其 Code Arena 排行榜前 6 名。通过 Codex Harness 进行评估,该模型在实际 Web 开发中展现出强大能力,具体来说,在多文件 React 任务中排名第 6,并在单文件 HTML 任务中跻身前 10 名。这一基准测试将其定位为 Google Gemini 3.1 Pro Preview 在编码领域的直接竞争对手。
📊 文章信息
AI 评分:88
来源:lmarena.ai(@lmarena_ai)
作者:Arena.ai
分类:人工智能
语言:英文
阅读时间:2 分钟
字数:275
标签: GPT-5.4, LMArena, Code Arena, OpenAI, 基准测试