全部 未讀 (26452) ★ 收藏 (0) 🤖 人工智能 (11835) 📊 商业科技 (5222) 📁 媒体资讯 (2229) 💻 软件编程 (1809) 📁 个人成长 (1687) 📁 生活文化 (1496) 📁 投资财经 (1333) 🎨 产品设计 (462) 📁 体育运动 (331) 📁 AI 产品 (39)
篩選中: 🏷️ AudioDiT 共 1 篇 ✕ 清除篩選
26454
全部文章
26452
未讀
112
今日新增
0
收藏
📡 Poller 最後抓取: 29 分鐘前 (06-25 14:00)
BestBlogs 精選 (26400)

🏷️ 熱門標籤

AI Agent 2497 AI 编程 1141 Anthropic 1025 Claude Code 956 LLM 862 政策解读 861 AI 智能体 781 产业动态 767 OpenAI 761 投资与市场 756 宏观经济 659 地缘政治 598 开源 592 国际新闻 576 科技新闻 575 Claude 570 OpenClaw 557 社会议题 557 AI 537 AI 安全 517
突破零样本 TTS 音色克隆上限:LongCat-AudioDiT 的声音克隆艺术
📌 一句话摘要 美团 LongCat 团队开源了 LongCat-AudioDiT,一种直接在波形潜空间进行端到端生成的零样本语音克隆模型,通过修复训练-推理不匹配和引入自适应投影引导,在 Seed 基准上取得了 SOTA 的说话人相似度。 📝 详细摘要 本文详细介绍了美团 LongCat 团队
📅 2026-04-20 08:00 (04-20 08:00) 作者: 美团LongCat 人工智能 2 分鐘 ★ 91
语音合成 TTS 零样本克隆 扩散模型