谷歌发布了最新的 TTS 模型 Gemini 3.1 Flash TTS,其亮点是场景指导功能,并原生支持说话人级别控制、70+ 种语言等特性。
📝 详细摘要
这条推文介绍了谷歌最新发布的文本转语音模型 Gemini 3.1 Flash TTS。核心亮点是「场景指导」功能,允许用户设置对话发生的场景并提供表演指示,以帮助角色在多轮对话中保持状态。此外,该模型还支持说话人级特异性、自然语言音频标签、行内调整,并可将配置好的参数一键导出为 Gemini API 代码。推文引用了官方发布内容,并附带了介绍视频。
📊 文章信息
AI 初评:78
来源:AIGCLINK(@aigclink)
作者:AIGCLINK
分类:人工智能
语言:中文
阅读时间:1 分钟
字数:182
标签: Gemini 3.1 Flash TTS, TTS, 谷歌, 语音合成, AI 产品