← 回總覽

GPT-5.4-high 跻身 LMArena 基准测试 Code Arena 前六

📅 2026-03-13 00:07 Arena.ai 人工智能 1 分鐘 593 字 評分: 88
GPT-5.4 LMArena Code Arena OpenAI 基准测试
📌 一句话摘要 OpenAI 全新 GPT-5.4-high 模型在 Code Arena 中跻身前 6,在 Web 开发领域展现出与 Gemini 3.1 Pro 相媲美的性能。 📝 详细摘要 LMArena(前身为 LMSYS)宣布,OpenAI 最新的 GPT-5.4-high 模型已成功进入其 Code Arena 排行榜前 6 名。通过 Codex Harness 进行评估,该模型在实际 Web 开发中展现出强大能力,具体来说,在多文件 React 任务中排名第 6,并在单文件 HTML 任务中跻身前 10 名。这一基准测试将其定位为 Google Gemini 3.1 Pro

📌 一句话摘要

OpenAI 全新 GPT-5.4-high 模型在 Code Arena 中跻身前 6,在 Web 开发领域展现出与 Gemini 3.1 Pro 相媲美的性能。

📝 详细摘要

LMArena(前身为 LMSYS)宣布,OpenAI 最新的 GPT-5.4-high 模型已成功进入其 Code Arena 排行榜前 6 名。通过 Codex Harness 进行评估,该模型在实际 Web 开发中展现出强大能力,具体来说,在多文件 React 任务中排名第 6,并在单文件 HTML 任务中跻身前 10 名。这一基准测试将其定位为 Google Gemini 3.1 Pro Preview 在编码领域的直接竞争对手。

📊 文章信息

AI 评分:88

来源:lmarena.ai(@lmarena_ai)

作者:Arena.ai

分类:人工智能

语言:英文

阅读时间:2 分钟

字数:275

标签: GPT-5.4, LMArena, Code Arena, OpenAI, 基准测试

阅读推文

查看原文 → 發佈: 2026-03-13 00:07:26 收錄: 2026-03-13 02:00:41

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。