← 回總覽

阶跃最新语音模型位列 Artificial Analysis 评测榜中国第一

📅 2026-05-09 18:29 量子位的朋友们 人工智能 2 分鐘 1536 字 評分: 84
阶跃 StepAudio 语音模型 TTS Artificial Analysis
📌 一句话摘要 阶跃 StepAudio 2.5 TTS 语音模型在 Artificial Analysis 盲测榜单中位列全球前三、中国第一,标志着其在真实用户听感上已达到国际顶尖水平。 📝 详细摘要 文章报道了阶跃 StepAudio 2.5 TTS 语音模型在 Artificial Analysis Speech Arena Leaderboard 上取得全球前三、中国第一的排名。该榜单采用盲测 Elo 评分机制,由用户直接对两段语音进行听感判断,覆盖客服、知识分享、数字助手等真实场景,因此该排名反映了模型在真实听感上的自然度和竞争力。文章还介绍了阶跃近期发布的 StepAudio

📌 一句话摘要

阶跃 StepAudio 2.5 TTS 语音模型在 Artificial Analysis 盲测榜单中位列全球前三、中国第一,标志着其在真实用户听感上已达到国际顶尖水平。

📝 详细摘要

文章报道了阶跃 StepAudio 2.5 TTS 语音模型在 Artificial Analysis Speech Arena Leaderboard 上取得全球前三、中国第一的排名。该榜单采用盲测 Elo 评分机制,由用户直接对两段语音进行听感判断,覆盖客服、知识分享、数字助手等真实场景,因此该排名反映了模型在真实听感上的自然度和竞争力。文章还介绍了阶跃近期发布的 StepAudio 2.5 系列模型,包括 TTS、ASR 和 Realtime 三款,覆盖语音生成、识别与实时交互全链路。其中 StepAudio 2.5 Realtime 强调打造有「活人感」的 AI 聊天搭子。此外,文章提及阶跃在 AI 语音领域的长期布局,包括开源模型 Step Audio R1.1 和 Step Audio EditX 的领先表现,以及其在吉利银河 M9 和极氪 8X 等车型上的商业化落地。

💡 主要观点

- StepAudio 2.5 TTS 在盲测榜单中位列全球前三、中国第一。 该榜单采用盲测 Elo 评分机制,由用户直接对语音进行听感判断,排名反映了模型在真实场景下的自然度和竞争力,而非单纯参数指标。

阶跃发布 StepAudio 2.5 系列模型,覆盖语音全链路。 系列包括 TTS(语音生成)、ASR(语音识别)和 Realtime(实时交互)三款模型,其中 Realtime 模型强调打造有「活人感」的 AI 聊天搭子,具备副语言能力和人设自定义功能。
阶跃在 AI 语音领域有长期布局,开源模型表现突出。 开源模型 Step Audio R1.1 连续 4 个月霸榜 Speech Reasoning 榜单全球第一,Step Audio EditX 在零样本音色复刻上表现优异,位列开源榜全球第二。
阶跃语音模型已实现规模化商业落地。 已在吉利银河 M9 和极氪 8X 等车型上实现端到端语音大模型量产上车,展示了其在车载场景的实用价值。

💬 文章金句

- StepAudio 2.5 TTS 跻身全球前三,成为当前榜单排名最高的中国大模型。

  • 该榜单采用盲测 Elo 评分机制,由用户在不知道模型身份的情况下,直接对同一文本生成的两段语音进行听感判断。
  • StepAudio 2.5 Realtime 聚焦打造更有'活人感'的 AI 聊天搭子,具备顶级副语言能力、千万人设自定义、领先智商情商等特点。

📊 文章信息

AI 初评:84

来源:量子位

作者:量子位的朋友们

分类:人工智能

语言:中文

阅读时间:3 分钟

字数:706

标签: 阶跃, StepAudio, 语音模型, TTS, Artificial Analysis

阅读完整文章

查看原文 → 發佈: 2026-05-09 18:29:31 收錄: 2026-05-09 20:00:15

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。