全部 未讀 (21615) ★ 收藏 (0) 🤖 人工智能 (11168) 📊 商业科技 (4461) 💻 软件编程 (1685) 📁 个人成长 (1605) 📁 生活文化 (857) 📁 媒体资讯 (827) 📁 投资财经 (529) 🎨 产品设计 (408) 📁 AI 产品 (39) 📁 体育运动 (28)
篩選中: 🏷️ Omni 共 46 篇 ✕ 清除篩選
21617
全部文章
21615
未讀
204
今日新增
0
收藏
📡 Poller 最後抓取: 11 分鐘前 (06-08 20:00)
BestBlogs 精選 (21582)

🏷️ 熱門標籤

AI Agent 2157 AI 编程 985 Anthropic 981 Claude Code 916 AI 智能体 780 OpenAI 745 LLM 674 开源 574 OpenClaw 557 Claude 557 AI 517 AI 安全 490 开发者工具 432 Codex 416 软件工程 398 具身智能 334 Agent 334 个人成长 331 GitHub 321 生产力 315
Google Gemini Omni 实现「像聊天一样编辑视频」
📌 一句话摘要 展示 Google Gemini Omni 的视频编辑能力,可以通过自然语言指令将视频场景从海边无缝切换到沙漠,并保持人物和物理效果一致。 📝 详细摘要 该推文展示了一个 Google Gemini Omni 的视频编辑演示。通过简单的自然语言指令「请将场景设置为沙漠环境(其他设
📅 2026-06-02 10:23 (6 天前) AI Will 人工智能 1 分鐘 ★ 85
Google Gemini Omni 视频编辑 AI 视频
Gemini Omni 视频编辑演示详解
📌 一句话摘要 详细描述 Google Gemini Omni 视频编辑演示的效果:同一个人、同一段动作,场景从海边无缝切换到沙漠,衣服和物理效果保持一致。 📝 详细摘要 此推文是上一条推文的补充,更详细地描述了 Gemini Omni 视频编辑演示的效果。它强调了「同一个人,同一段动作,从海边
📅 2026-06-02 10:26 (6 天前) AI Will 人工智能 1 分鐘 ★ 76
Google Gemini Omni 视频编辑 AI 视频
Gemini Omni 视频编辑能力惊人,10 个离谱案例
📌 一句话摘要 推文介绍 Gemini Omni 的视频编辑能力,并预告将展示 10 个令人惊叹的使用案例。 📝 详细摘要 该推文作为 Thread 的开篇,介绍了 Gemini Omni 强大的视频编辑能力,称其「太夸张了」,并预告将展示 10 个「离谱案例」。推文获得了较高的互动量(330
📅 2026-05-31 16:04 (8 天前) AI Will 人工智能 1 分鐘 ★ 82
Gemini Omni 视频编辑 AI 产品 Google
AI 视频生成新玩法:一句提示词拍出超能力短片
📌 一句话摘要 有人用一句提示词通过 AI 视频生成工具拍出超能力短片,效果令人惊叹。 📝 详细摘要 该推文分享了一个 AI 视频生成的创意案例:用户仅用一句提示词「用心灵力量让电视仿佛被抬起来一样——当手握成拳头时,电视就会在半空中被捏碎」,就生成了一段超能力短片。推文作者认为效果「像魔法」,
📅 2026-05-29 10:23 (10 天前) AI Will 人工智能 1 分鐘 ★ 80
AI 视频生成 Omni 提示词工程 创意内容
Gemini Omni Flash 视频演示:在黑板上解方程
📌 一句话摘要 作者展示了一段由 Gemini Omni Flash 生成的、在黑板上解方程的视频,并评论其目前版本尚不可商用。 📝 详细摘要 该推文展示了一段由 Gemini Omni Flash 生成的视频,内容是在黑板上逐步解方程 4(x-3)^2 = 25。作者评论称,Omni Flas
📅 2026-05-21 10:23 (18 天前) Gorden Sun 人工智能 1 分鐘 ★ 78
Gemini Omni 视频生成 Google AI演示
Google 一口气发了多少东西?I/O 2026 完整梳理
📌 一句话摘要 本文全面梳理了 Google I/O 2026 大会发布的核心内容,涵盖从 TPU 芯片、Gemini Omni 与 3.5 Flash 模型,到 Antigravity Agent 平台、Gemini Spark 个人 AI Agent 以及 Search 的 Agent 化演进
📅 2026-05-20 10:02 (19 天前) AI寒武纪 人工智能 2 分鐘 ★ 86
Google I/O Gemini Omni Gemini 3.5 Flash TPU
Google I/O 2026:单日 3 万亿 Token!Gemini Flash 3.5 重塑开发平台 Antigravity,智能体优先!世界模型 Omni 登场!Spark 对标 OpenClaw!
📌 一句话摘要 Google I/O 2026 大会发布 Gemini 3.5 Flash、世界模型 Gemini Omni、智能体优先开发平台 Antigravity 2.0 及智能体商业协议等重磅产品,全面转向 Agentic AI 时代。 📝 详细摘要 本文详细报道了 Google I/O
📅 2026-05-20 12:10 (19 天前) 51CTO技术栈 人工智能 2 分鐘 ★ 87
Google I/O 2026 Gemini 3.5 Flash Gemini Omni Antigravity
TLiveOmni 1.0: 直播视频多模态理解大模型
📌 一句话摘要 TLiveOmni 1.0 是阿里巴巴大淘宝技术团队推出的面向电商直播场景的全模态大模型,原生支持图像、文本、视频、音频四模态统一输入,在语音识别、商品定位等任务上达到 SOTA 水平。 📝 详细摘要 本文详细介绍了由阿里巴巴大淘宝技术团队研发的 TLiveOmni 1.0 全模
📅 2026-05-20 16:26 (19 天前) 大淘宝技术 人工智能 2 分鐘 ★ 90
全模态大模型 电商直播 TLiveOmni 多模态理解
谷歌 I/O 大会,Gemini 3.5、Agent 全家桶逐一亮相,Android 被挤下牌桌?
📌 一句话摘要 谷歌 I/O 2026 发布 Gemini 3.5 Flash 模型、Gemini Omni 多模态模型、Antigravity 2.0 智能体平台及 Gemini Spark 个人 AI 管家,核心战略从追求模型最强转向降低 Agent 部署成本。 📝 详细摘要 本文详细报道了
📅 2026-05-20 07:26 (19 天前) 腾讯科技 人工智能 2 分鐘 ★ 88
Google I/O Gemini 3.5 Agent Antigravity
Gemini Omni:Google 发布原生多模态视频生成模型
📌 一句话摘要 Google 在 I/O 2026 发布 Gemini Omni,一个原生多模态的视频理解与生成模型,支持对话式视频编辑和任意参考物组合。 📝 详细摘要 该推文深入解读了 Google 发布的 Gemini Omni 模型,这是一个原生多模态的视频理解与生成模型,与 Veo 等传
📅 2026-05-20 09:02 (19 天前) meng shao 人工智能 1 分鐘 ★ 89
Gemini Omni Google I/O 视频生成 多模态模型
谷歌用 AI 「杀死」谷歌,这场发布会看得人缺氧
📌 一句话摘要 Google I/O 2026 大会发布 Gemini Omni 世界模型、Gemini 3.5 Flash 极速模型、Antigravity 2.0 Agent 开发平台、Gemini Spark 个人 Agent 以及全新 AI 搜索体验,全面推动从免费互联网服务向 AI 订阅
📅 2026-05-20 13:52 (19 天前) 张子豪 人工智能 2 分鐘 ★ 87
Google I/O Gemini Omni Gemini 3.5 Flash Antigravity
jina-embeddings-v5-omni 发布!全模态向量小模型
📌 一句话摘要 Jina AI 发布 jina-embeddings-v5-omni 全模态向量模型,通过冻结文本底座并仅训练 0.35% 的投影层参数,以极低成本实现了文本、图像、音频、视频四模态支持,且文本向量与 v5-text 逐字节一致,无需重建索引。 📝 详细摘要 Jina AI 正式
📅 2026-05-14 17:37 (25 天前) 魔搭ModelScope社区 人工智能 2 分鐘 ★ 86
jina-embeddings-v5-omni 多模态向量模型 Jina AI 嵌入模型
今日开源(2026-5-8):小米发布 OmniVoice,新型扩散语言模型支撑大规模多语言 TTS,语音克隆与音色设计双能力集成
📌 一句话摘要 本文汇总了 2026 年 5 月 8 日发布的 7 个开源 AI 项目,涵盖多语言语音合成、大语言模型、视觉推理、机器人仿真和视频处理等前沿方向。 📝 详细摘要 文章以项目简报形式介绍了当日发布的 7 个重要开源 AI 项目。核心项目包括:小米推出的 OmniVoice,基于扩散
📅 2026-05-08 18:30 (05-08 18:30) 机器之心SOTA模型 人工智能 2 分鐘 ★ 80
开源项目 OmniVoice OpenSeek-Mid-v1 Laser
超 600 种语言,一个模型全搞定! 小米开源 OmniVoice 多语言语音克隆 TTS
📌 一句话摘要 小米 AI 实验室开源 OmniVoice,一个基于极简双向 Transformer 架构、覆盖 646 种语言、性能超越商用系统的多语言语音克隆 TTS 模型。 📝 详细摘要 小米 AI 实验室 Kaldi 团队推出并全面开源了 OmniVoice,这是一个创新的多语言语音克隆
📅 2026-05-07 17:00 (05-07 17:00) 小米技术 人工智能 2 分鐘 ★ 86
OmniVoice 语音克隆 TTS 多语言
王兴兴亲测后点赞!这家 AI 公司提前半年把“龙虾”能力带上车,还管住了 Token 黑洞
📌 一句话摘要 斑马智能发布「元神 AI」升级版,推出全模态端侧大模型产品矩阵 AutoOmni 和「龙虾上车」方案 AutoClaw,旨在将智能座舱从功能集合进化为可主动协作的汽车机器人大脑。 📝 详细摘要 本文报道了斑马智能在 AI TECH DAY 上发布的技术升级。核心是「元神 AI 汽
📅 2026-05-02 10:31 (05-02 10:31) InfoQ 中文 人工智能 2 分鐘 ★ 86
智能座舱 端侧大模型 Agent AutoOmni
OmniGe:开源桌面学习工具,整合课程下载、视频播放、电子书阅读与笔记
📌 一句话摘要 GitHubDaily 推荐了一款名为 OmniGe 的开源桌面应用,它将课程下载、视频播放、电子书阅读和笔记功能整合在一个界面中,支持从多个平台下载课程,并提供 PDF/EPUB 阅读、闪卡、番茄钟等学习工具。 📝 详细摘要 该推文介绍了一款名为 OmniGe 的开源桌面应用,
📅 2026-05-02 12:00 (05-02 12:00) GitHubDaily 个人成长 1 分鐘 ★ 82
OmniGe 开源工具 学习工具 课程下载
MiniCPM-o 4.5 技术报告发布:全双工全模态 API 开放,RTX5070 即可实时运行
📌 一句话摘要 面壁智能联合清华大学发布 MiniCPM-o 4.5 技术报告,首次公开 Omni-Flow 流式全模态框架,实现 9B 参数端到端全双工全模态交互,RTX5070 即可本地运行。 📝 详细摘要 本文是 AI 前线对 MiniCPM-o 4.5 技术报告发布的报道。文章介绍了面壁
📅 2026-04-30 10:32 (04-30 10:32) AI前线 人工智能 2 分鐘 ★ 86
MiniCPM-o 4.5 全双工 全模态 Omni-Flow
英伟达全模态大模型来了,几秒搞定老黄 3 分钟演讲,吞吐量同类 9 倍
📌 一句话摘要 英伟达发布全模态开源模型 Nemotron 3 Nano Omni,在单一架构内融合文本、视觉、语音处理能力,吞吐量达同类模型的 9 倍,并已在多项基准测试中取得领先。 📝 详细摘要 英伟达于 2026 年 4 月 28 日推出 Nemotron 3 Nano Omni,这是一款
📅 2026-04-29 17:00 (04-29 17:00) 智东西 人工智能 2 分鐘 ★ 85
英伟达 Nemotron 3 Nano Omni 多模态模型 MoE
今日开源(2026-4-29):商汤 SenseNova-U1 推出,原生架构兼顾性能与效率,语言视觉统一处理突破适配器限制
📌 一句话摘要 本文汇总了 2026 年 4 月 29 日发布的 6 个开源 AI 项目,涵盖原生多模态模型 SenseNova-U1、NVIDIA Nemotron-3-Nano-Omni、机器人基础模型 LDA、VLA 基准 EBench、零样本提示重加权方法 CARPRT 和 3D 理解框架
📅 2026-04-29 18:30 (04-29 18:30) 机器之心SOTA模型 人工智能 2 分鐘 ★ 80
开源项目 多模态模型 SenseNova-U1 Nemotron-3-Nano-Omni
MiniCPM-o 4.5 技术报告发布:全双工全模态 API 开放,RTX5070 即可实时运行
📌 一句话摘要 面壁智能联合清华大学发布 MiniCPM-o 4.5 技术报告,首次公开 Omni-Flow 流式全模态框架,实现 9B 参数下的端到端全双工全模态交互,并开放 API、端侧安装包及 Demo 源码。 📝 详细摘要 本文是 AI 科技评论对 MiniCPM-o 4.5 技术报告发
📅 2026-04-28 13:10 (04-28 13:10) AI科技评论 人工智能 2 分鐘 ★ 85
MiniCPM-o 4.5 全双工全模态 Omni-Flow 面壁智能