阶跃星辰新一代语音生成模型 StepAudio 2.5 TTS 在 Artificial Analysis 评测榜上位列中国第一、全球前三,文章介绍了其核心能力和技术突破。
📝 详细摘要
阶跃星辰官方宣布其新一代语音生成模型 StepAudio 2.5 TTS 在 Artificial Analysis Speech Arena Leaderboard 上取得中国第一、全球前三的成绩。该榜单采用盲测 Elo 评分机制,在客服、知识分享、数字助手和娱乐四大场景中评估语音的自然度和拟人度。文章介绍了 StepAudio 2.5 TTS 的三大核心能力:全局语境控制(自定义情绪基调和场景氛围)、文中语境控制(调节语气、节奏、停顿等细节)以及零样本复刻与全音色控制(保留音色特征的同时灵活调节情感和风格)。文章还回顾了阶跃在语音技术领域的其他关键突破,包括开源语音推理模型 Step Audio R1.1、迭代式情绪风格语音编辑模型 Step Audio EditX,以及千亿参数端到端语音大模型 Step-1o 在吉利银河 M9 上的首次上车应用。
💡 主要观点
- StepAudio 2.5 TTS 在 Artificial Analysis 评测榜上位列中国第一、全球前三。 该榜单采用盲测 Elo 评分机制,在客服、知识分享、数字助手和娱乐四大真实场景中评估语音自然度,排名反映了模型在真实用户听感中的领先水平。
💬 文章金句
- StepAudio 2.5 TTS 成功跻身全球前三,成为该榜单上排名最高的中国大模型。
- 语音不仅是传递信息的工具,更是承载情绪、个性与意图的灵魂载体。
- 让 AI 的每一次有声表达都更灵动自然。
📊 文章信息
AI 初评:82
来源:阶跃星辰
作者:阶跃星辰
分类:人工智能
语言:中文
阅读时间:4 分钟
字数:865
标签: 阶跃星辰, StepAudio 2.5, TTS, 语音生成, Artificial Analysis