阶跃最新语音模型位列 Artificial Analysis 评测榜中国第一

📌 一句话摘要

阶跃 StepAudio 2.5 TTS 语音模型在 Artificial Analysis 盲测榜单中位列全球前三、中国第一，标志着其在真实用户听感上已达到国际顶尖水平。

📝 详细摘要

文章报道了阶跃 StepAudio 2.5 TTS 语音模型在 Artificial Analysis Speech Arena Leaderboard 上取得全球前三、中国第一的排名。该榜单采用盲测 Elo 评分机制，由用户直接对两段语音进行听感判断，覆盖客服、知识分享、数字助手等真实场景，因此该排名反映了模型在真实听感上的自然度和竞争力。文章还介绍了阶跃近期发布的 StepAudio 2.5 系列模型，包括 TTS、ASR 和 Realtime 三款，覆盖语音生成、识别与实时交互全链路。其中 StepAudio 2.5 Realtime 强调打造有「活人感」的 AI 聊天搭子。此外，文章提及阶跃在 AI 语音领域的长期布局，包括开源模型 Step Audio R1.1 和 Step Audio EditX 的领先表现，以及其在吉利银河 M9 和极氪 8X 等车型上的商业化落地。

💡 主要观点

- StepAudio 2.5 TTS 在盲测榜单中位列全球前三、中国第一。 该榜单采用盲测 Elo 评分机制，由用户直接对语音进行听感判断，排名反映了模型在真实场景下的自然度和竞争力，而非单纯参数指标。

阶跃发布 StepAudio 2.5 系列模型，覆盖语音全链路。 系列包括 TTS（语音生成）、ASR（语音识别）和 Realtime（实时交互）三款模型，其中 Realtime 模型强调打造有「活人感」的 AI 聊天搭子，具备副语言能力和人设自定义功能。

阶跃在 AI 语音领域有长期布局，开源模型表现突出。 开源模型 Step Audio R1.1 连续 4 个月霸榜 Speech Reasoning 榜单全球第一，Step Audio EditX 在零样本音色复刻上表现优异，位列开源榜全球第二。

阶跃语音模型已实现规模化商业落地。 已在吉利银河 M9 和极氪 8X 等车型上实现端到端语音大模型量产上车，展示了其在车载场景的实用价值。

💬 文章金句

- StepAudio 2.5 TTS 跻身全球前三，成为当前榜单排名最高的中国大模型。

该榜单采用盲测 Elo 评分机制，由用户在不知道模型身份的情况下，直接对同一文本生成的两段语音进行听感判断。
StepAudio 2.5 Realtime 聚焦打造更有'活人感'的 AI 聊天搭子，具备顶级副语言能力、千万人设自定义、领先智商情商等特点。

📊 文章信息

AI 初评：84

来源：量子位

作者：量子位的朋友们

分类：人工智能

语言：中文

阅读时间：3 分钟

字数：706

标签：阶跃, StepAudio, 语音模型, TTS, Artificial Analysis

阅读完整文章

阶跃最新语音模型位列 Artificial Analysis 评测榜中国第一

🤖 問 AI