全部 未讀 (26410) ★ 收藏 (0) 🤖 人工智能 (11826) 📊 商业科技 (5211) 📁 媒体资讯 (2221) 💻 软件编程 (1809) 📁 个人成长 (1687) 📁 生活文化 (1493) 📁 投资财经 (1323) 🎨 产品设计 (462) 📁 体育运动 (330) 📁 AI 产品 (39)
篩選中: 🏷️ 克隆 共 13 篇 ✕ 清除篩選
26412
全部文章
26410
未讀
70
今日新增
0
收藏
📡 Poller 最後抓取: 1 小時前 (06-25 10:00)
BestBlogs 精選 (26358)

🏷️ 熱門標籤

AI Agent 2493 AI 编程 1141 Anthropic 1024 Claude Code 956 LLM 861 政策解读 857 AI 智能体 781 产业动态 766 OpenAI 761 投资与市场 753 宏观经济 655 地缘政治 597 开源 592 科技新闻 573 国际新闻 573 Claude 570 OpenClaw 557 社会议题 555 AI 537 AI 安全 517
子曰 4 TTS 多语言克隆效果实测,支持 14 种语言
📌 一句话摘要 作者实测子曰 4 TTS 引擎,用中文克隆声音后合成英文、日语、法语、德语语音,效果自然。 📝 详细摘要 作为上一条推文的补充,该推文展示了作者对子曰 4 TTS 引擎的进一步测试。作者用中文克隆声音后,将经典电影台词翻译成英文、日语、法语、德语并合成语音,认为声音自然、情绪传递
📅 2026-05-26 14:08 (29 天前) 向阳乔木 人工智能 1 分鐘 ★ 78
子曰4 TTS 声音克隆 多语言
超 600 种语言,一个模型全搞定! 小米开源 OmniVoice 多语言语音克隆 TTS
📌 一句话摘要 小米 AI 实验室开源 OmniVoice,一个基于极简双向 Transformer 架构、覆盖 646 种语言、性能超越商用系统的多语言语音克隆 TTS 模型。 📝 详细摘要 小米 AI 实验室 Kaldi 团队推出并全面开源了 OmniVoice,这是一个创新的多语言语音克隆
📅 2026-05-07 17:00 (05-07 17:00) 小米技术 人工智能 2 分鐘 ★ 86
OmniVoice 语音克隆 TTS 多语言
为了永生,硅谷富豪想要养「无脑人」?
📌 一句话摘要 本文报道了硅谷公司 R3 Bio 计划通过基因编辑制造无脑克隆人体作为富豪的器官库,并梳理了硅谷富豪们在换血、细胞重编程、意识上传等永生赛道上的疯狂投资与争议。 📝 详细摘要 文章以 R3 Bio 公司的「身体替换克隆」计划为引子,详细介绍了其三步路线图:从基因编辑老鼠验证技术,
📅 2026-05-06 21:30 (05-06 21:30) 36氪 商业科技 1 分鐘 ★ 82
硅谷 永生 克隆 长寿
突破零样本 TTS 音色克隆上限:LongCat-AudioDiT 的声音克隆艺术
📌 一句话摘要 美团 LongCat 团队开源了 LongCat-AudioDiT,一种直接在波形潜空间进行端到端生成的零样本语音克隆模型,通过修复训练-推理不匹配和引入自适应投影引导,在 Seed 基准上取得了 SOTA 的说话人相似度。 📝 详细摘要 本文详细介绍了美团 LongCat 团队
📅 2026-04-20 08:00 (04-20 08:00) 作者: 美团LongCat 人工智能 2 分鐘 ★ 91
语音合成 TTS 零样本克隆 扩散模型
ElevenLabs 11 倍积分促销的创意应用场景
📌 一句话摘要 ElevenLabs 展示了即将到来的 11 倍积分优惠在有声书、播客和游戏音效等方面的多种创意应用。 📝 详细摘要 作为促销公告的后续,这条推文列举了用户可以利用 11 倍积分价值的具体创意场景。建议的用例包括朗读有声书、为视频添加旁白、为短片创作原创配乐、通过声音克隆制作播客
📅 2026-04-11 05:01 (04-11 05:01) ElevenLabs 人工智能 1 分鐘 ★ 76
ElevenLabs AI 创意工具 声音克隆 音效
VoxCPM2:强大的开源 AI 语音克隆模型
📌 一句话摘要 VoxCPM2 是清华大学推出的一款新型开源 AI 语音模型,支持 30 种语言的高质量语音克隆与设计,在基准测试中表现优于 ElevenLabs 等商业服务。 📝 详细摘要 此推文介绍了 VoxCPM2,这是针对 ElevenLabs 等付费服务的开源替代方案。该模型由 Ope
📅 2026-04-10 16:21 (04-10 16:21) Nav Toor 人工智能 1 分鐘 ★ 86
VoxCPM2 开源 AI 语音克隆 清华大学
Mistral AI 开源首个 TTS 模型 Voxtral:4B 参数实现 3 秒语音克隆
📌 一句话摘要 Mistral AI 发布开源 TTS 模型 Voxtral,支持 3 秒零样本语音克隆与多语言迁移,可在移动端本地运行。 📝 详细摘要 Mistral AI 推出了其首个开源文本转语音(TTS)模型 Voxtral。该模型拥有 4B 参数,采用混合架构(自回归语义生成 + 流匹
📅 2026-04-09 21:21 (04-09 21:21) meng shao 人工智能 1 分鐘 ★ 89
Mistral AI Voxtral TTS 语音克隆
小米开源 OmniVoice:覆盖 600+ 语种的 SOTA 语音克隆 TTS
📌 一句话摘要 小米最新开源的 OmniVoice 语音克隆模型支持 600 多种语言,在中英文测试中达到 SOTA 水平,合成效率比实时快 40 倍。 📝 详细摘要 小米发布并开源了名为 OmniVoice 的语音克隆 TTS 模型。该模型采用扩散语言模型风格的离散非自回归架构,实现了从文本到
📅 2026-04-08 16:51 (04-08 16:51) AIGCLINK 人工智能 1 分鐘 ★ 86
OmniVoice 小米开源 TTS 语音克隆
富豪强行续命:把大脑塞进无脑克隆体,硅谷的永生执念
📌 一句话摘要 本文探讨了硅谷初创公司 R3Bio 提出的“无脑克隆体”器官培育计划,分析了其在器官移植、全身替换方面的构想、技术挑战及引发的巨大伦理争议。 📝 详细摘要 文章介绍了硅谷初创公司 R3Bio 的激进构想:通过培育无大脑的克隆体,为人类提供器官来源,甚至作为大脑移植的载体以实现“永
📅 2026-03-31 14:56 (03-31 14:56) 网易科技 商业科技 1 分鐘 ★ 80
生物技术 R3Bio 器官移植 克隆技术
在波兰担任欧盟理事会主席国期间扩展多语言外交
📌 一句话摘要 ElevenLabs 与波兰欧盟理事会主席国合作,为部长级新闻发布会实施了 AI 驱动的多语言配音,在确保可访问性的同时保持了演讲者的真实性和安全性。 📝 详细摘要 本文详细介绍了 ElevenLabs 与欧盟理事会秘书处在 2025 年波兰担任欧盟理事会主席国期间的一项里程碑式
📅 2026-03-31 17:24 (03-31 17:24) Dan Hegedus, Imogen Mulliner 人工智能 1 分鐘 ★ 82
AI 配音 多语言交流 ElevenLabs 外交
Lightning V3.1 语音克隆演示
📌 一句话摘要 展示了 Lightning V3.1 的实时语音克隆能力,无需微调,仅需 15 秒即可实现生产级效果。 📝 详细摘要 这条推文展示了新发布的 Lightning V3.1 模型的语音克隆功能。作者通过在 15 秒内克隆康纳·麦格雷戈 (Conor McGregor) 的声音,突显
📅 2026-03-25 23:59 (03-25 23:59) Nav Toor 人工智能 1 分鐘 ★ 82
LightningV3.1 语音克隆 TTS AI
通过 EgoVerse 突破远程操作,实现机器人学习的规模化
📌 一句话摘要 Jim Fan 探讨了行业从远程操作向行为克隆的转变,利用全新的 EgoVerse 生态系统,在无需物理机器人的情况下实现机器人学习的规模化。 📝 详细摘要 作为 NVIDIA 机器人技术总监,Jim Fan 提供了关于机器人学习演进的专家视角。他指出,该领域正从远程操作转向行为
📅 2026-03-24 01:41 (03-24 01:41) Jim Fan 人工智能 3 分鐘 ★ 83
机器人学 机器人学习 EgoVerse 行为克隆
Chatterbox:全新开源的 10 秒声音克隆工具
📌 一句话摘要 Chatterbox 是一款 100% 开源工具,能从 10 秒音频片段中克隆任何声音,支持 23 种语言,并可在单个 GPU 上运行。 📝 详细摘要 这条推文介绍了 Chatterbox,它是 ElevenLabs 等付费服务的一个重要开源替代方案。它拥有一个 3.5 亿参数模
📅 2026-03-17 15:28 (03-17 15:28) Nav Toor 人工智能 4 分鐘 ★ 88
Chatterbox 语音克隆 开源 TTS