Fish Audio 正式开源 S2 系列 TTS 模型,具备 4B 参数并支持通过自然语言标签精准控制语音情感。
📝 详细摘要
本推文介绍了 Fish Audio 最新开源的 S2 模型。该模型拥有 4B 参数,支持 80 种语言,响应速度极快(100ms)。其核心亮点在于支持通过在文本中嵌入方括号形式的自然语言指令(如 [用很沮丧的语气])来动态控制 AI 的情感表达和语气,显著提升了语音合成的自然度和表现力,甚至能模拟笑声。
📊 文章信息
AI 评分:86
来源:小互(@imxiaohu)
作者:小互
分类:人工智能
语言:中文
阅读时间:1 分钟
字数:192
标签: Fish Audio, S2, TTS, 语音合成, 开源模型