阶跃 StepAudio 2.5 TTS 语音模型在 Artificial Analysis 盲测榜单中位列全球前三、中国第一,标志着其在真实用户听感上已达到国际顶尖水平。
📝 详细摘要
文章报道了阶跃 StepAudio 2.5 TTS 语音模型在 Artificial Analysis Speech Arena Leaderboard 上取得全球前三、中国第一的排名。该榜单采用盲测 Elo 评分机制,由用户直接对两段语音进行听感判断,覆盖客服、知识分享、数字助手等真实场景,因此该排名反映了模型在真实听感上的自然度和竞争力。文章还介绍了阶跃近期发布的 StepAudio 2.5 系列模型,包括 TTS、ASR 和 Realtime 三款,覆盖语音生成、识别与实时交互全链路。其中 StepAudio 2.5 Realtime 强调打造有「活人感」的 AI 聊天搭子。此外,文章提及阶跃在 AI 语音领域的长期布局,包括开源模型 Step Audio R1.1 和 Step Audio EditX 的领先表现,以及其在吉利银河 M9 和极氪 8X 等车型上的商业化落地。
💡 主要观点
- StepAudio 2.5 TTS 在盲测榜单中位列全球前三、中国第一。 该榜单采用盲测 Elo 评分机制,由用户直接对语音进行听感判断,排名反映了模型在真实场景下的自然度和竞争力,而非单纯参数指标。
💬 文章金句
- StepAudio 2.5 TTS 跻身全球前三,成为当前榜单排名最高的中国大模型。
- 该榜单采用盲测 Elo 评分机制,由用户在不知道模型身份的情况下,直接对同一文本生成的两段语音进行听感判断。
- StepAudio 2.5 Realtime 聚焦打造更有'活人感'的 AI 聊天搭子,具备顶级副语言能力、千万人设自定义、领先智商情商等特点。
📊 文章信息
AI 初评:84
来源:量子位
作者:量子位的朋友们
分类:人工智能
语言:中文
阅读时间:3 分钟
字数:706
标签: 阶跃, StepAudio, 语音模型, TTS, Artificial Analysis