阶跃语音模型位列 Artificial Analysis 评测榜中国第一、全球前三

📌 一句话摘要

阶跃星辰新一代语音生成模型 StepAudio 2.5 TTS 在 Artificial Analysis 评测榜上位列中国第一、全球前三，文章介绍了其核心能力和技术突破。

📝 详细摘要

阶跃星辰官方宣布其新一代语音生成模型 StepAudio 2.5 TTS 在 Artificial Analysis Speech Arena Leaderboard 上取得中国第一、全球前三的成绩。该榜单采用盲测 Elo 评分机制，在客服、知识分享、数字助手和娱乐四大场景中评估语音的自然度和拟人度。文章介绍了 StepAudio 2.5 TTS 的三大核心能力：全局语境控制（自定义情绪基调和场景氛围）、文中语境控制（调节语气、节奏、停顿等细节）以及零样本复刻与全音色控制（保留音色特征的同时灵活调节情感和风格）。文章还回顾了阶跃在语音技术领域的其他关键突破，包括开源语音推理模型 Step Audio R1.1、迭代式情绪风格语音编辑模型 Step Audio EditX，以及千亿参数端到端语音大模型 Step-1o 在吉利银河 M9 上的首次上车应用。

💡 主要观点

- StepAudio 2.5 TTS 在 Artificial Analysis 评测榜上位列中国第一、全球前三。 该榜单采用盲测 Elo 评分机制，在客服、知识分享、数字助手和娱乐四大真实场景中评估语音自然度，排名反映了模型在真实用户听感中的领先水平。

模型具备全局语境控制、文中语境控制和零样本复刻三大核心能力。 全局语境控制可自定义整段语音的情绪基调；文中语境控制可精细调节语气、节奏和停顿；零样本复刻能在保留音色特征的同时灵活调整情感和风格。

阶跃在语音技术领域有多项关键突破，包括开源模型和端到端上车应用。 开源语音推理模型 Step Audio R1.1 在评测中登顶全球第一，千亿参数端到端语音大模型 Step-1o 已在吉利银河 M9 上实现首次上车应用。

💬 文章金句

- StepAudio 2.5 TTS 成功跻身全球前三，成为该榜单上排名最高的中国大模型。

语音不仅是传递信息的工具，更是承载情绪、个性与意图的灵魂载体。
让 AI 的每一次有声表达都更灵动自然。

📊 文章信息

AI 初评：82

来源：阶跃星辰

作者：阶跃星辰

分类：人工智能

语言：中文

阅读时间：4 分钟

字数：865

标签：阶跃星辰, StepAudio 2.5, TTS, 语音生成, Artificial Analysis

阅读完整文章

阶跃语音模型位列 Artificial Analysis 评测榜中国第一、全球前三

🤖 問 AI