GPT-5.4-high 跻身 LMArena 基准测试 Code Arena 前六

📅 2026-03-13 00:07 Arena.ai 人工智能 1 分鐘 593 字評分: 88

📌 一句话摘要 OpenAI 全新 GPT-5.4-high 模型在 Code Arena 中跻身前 6，在 Web 开发领域展现出与 Gemini 3.1 Pro 相媲美的性能。 📝 详细摘要 LMArena（前身为 LMSYS）宣布，OpenAI 最新的 GPT-5.4-high 模型已成功进入其 Code Arena 排行榜前 6 名。通过 Codex Harness 进行评估，该模型在实际 Web 开发中展现出强大能力，具体来说，在多文件 React 任务中排名第 6，并在单文件 HTML 任务中跻身前 10 名。这一基准测试将其定位为 Google Gemini 3.1 Pro

📌 一句话摘要

OpenAI 全新 GPT-5.4-high 模型在 Code Arena 中跻身前 6，在 Web 开发领域展现出与 Gemini 3.1 Pro 相媲美的性能。

📝 详细摘要

LMArena（前身为 LMSYS）宣布，OpenAI 最新的 GPT-5.4-high 模型已成功进入其 Code Arena 排行榜前 6 名。通过 Codex Harness 进行评估，该模型在实际 Web 开发中展现出强大能力，具体来说，在多文件 React 任务中排名第 6，并在单文件 HTML 任务中跻身前 10 名。这一基准测试将其定位为 Google Gemini 3.1 Pro Preview 在编码领域的直接竞争对手。

📊 文章信息

AI 评分：88

来源：lmarena.ai(@lmarena_ai)

作者：Arena.ai

分类：人工智能

语言：英文

阅读时间：2 分钟

字数：275

标签： GPT-5.4, LMArena, Code Arena, OpenAI, 基准测试

阅读推文

查看原文 → 發佈: 2026-03-13 00:07:26 收錄: 2026-03-13 02:00:41

GPT-5.4-high 跻身 LMArena 基准测试 Code Arena 前六

🤖 問 AI