← 回總覽

阶跃语音模型位列 Artificial Analysis 评测榜中国第一、全球前三

📅 2026-05-09 14:52 阶跃星辰 人工智能 2 分鐘 1353 字 評分: 82
阶跃星辰 StepAudio 2.5 TTS 语音生成 Artificial Analysis
📌 一句话摘要 阶跃星辰新一代语音生成模型 StepAudio 2.5 TTS 在 Artificial Analysis 评测榜上位列中国第一、全球前三,文章介绍了其核心能力和技术突破。 📝 详细摘要 阶跃星辰官方宣布其新一代语音生成模型 StepAudio 2.5 TTS 在 Artificial Analysis Speech Arena Leaderboard 上取得中国第一、全球前三的成绩。该榜单采用盲测 Elo 评分机制,在客服、知识分享、数字助手和娱乐四大场景中评估语音的自然度和拟人度。文章介绍了 StepAudio 2.5 TTS 的三大核心能力:全局语境控制(自定义情绪基

📌 一句话摘要

阶跃星辰新一代语音生成模型 StepAudio 2.5 TTS 在 Artificial Analysis 评测榜上位列中国第一、全球前三,文章介绍了其核心能力和技术突破。

📝 详细摘要

阶跃星辰官方宣布其新一代语音生成模型 StepAudio 2.5 TTS 在 Artificial Analysis Speech Arena Leaderboard 上取得中国第一、全球前三的成绩。该榜单采用盲测 Elo 评分机制,在客服、知识分享、数字助手和娱乐四大场景中评估语音的自然度和拟人度。文章介绍了 StepAudio 2.5 TTS 的三大核心能力:全局语境控制(自定义情绪基调和场景氛围)、文中语境控制(调节语气、节奏、停顿等细节)以及零样本复刻与全音色控制(保留音色特征的同时灵活调节情感和风格)。文章还回顾了阶跃在语音技术领域的其他关键突破,包括开源语音推理模型 Step Audio R1.1、迭代式情绪风格语音编辑模型 Step Audio EditX,以及千亿参数端到端语音大模型 Step-1o 在吉利银河 M9 上的首次上车应用。

💡 主要观点

- StepAudio 2.5 TTS 在 Artificial Analysis 评测榜上位列中国第一、全球前三。 该榜单采用盲测 Elo 评分机制,在客服、知识分享、数字助手和娱乐四大真实场景中评估语音自然度,排名反映了模型在真实用户听感中的领先水平。

模型具备全局语境控制、文中语境控制和零样本复刻三大核心能力。 全局语境控制可自定义整段语音的情绪基调;文中语境控制可精细调节语气、节奏和停顿;零样本复刻能在保留音色特征的同时灵活调整情感和风格。
阶跃在语音技术领域有多项关键突破,包括开源模型和端到端上车应用。 开源语音推理模型 Step Audio R1.1 在评测中登顶全球第一,千亿参数端到端语音大模型 Step-1o 已在吉利银河 M9 上实现首次上车应用。

💬 文章金句

- StepAudio 2.5 TTS 成功跻身全球前三,成为该榜单上排名最高的中国大模型。

  • 语音不仅是传递信息的工具,更是承载情绪、个性与意图的灵魂载体。
  • 让 AI 的每一次有声表达都更灵动自然。

📊 文章信息

AI 初评:82

来源:阶跃星辰

作者:阶跃星辰

分类:人工智能

语言:中文

阅读时间:4 分钟

字数:865

标签: 阶跃星辰, StepAudio 2.5, TTS, 语音生成, Artificial Analysis

阅读完整文章

查看原文 → 發佈: 2026-05-09 14:52:00 收錄: 2026-05-10 02:00:57

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。