全部 未讀 (11821) ★ 收藏 (0) 🤖 人工智能 (7594) 📊 商业科技 (1791) 💻 软件编程 (1198) 📁 个人成长 (736) 🎨 产品设计 (209) 📁 生活文化 (109) 📁 投资财经 (71) 📁 媒体资讯 (69) 📁 AI 产品 (39) 📁 AI (5)
篩選中: 🏷️ CVPR 2026 共 8 篇 ✕ 清除篩選
11823
全部文章
11821
未讀
140
今日新增
0
收藏
📡 Poller 最後抓取: 1 小時前 (04-16 14:00)
BestBlogs 精選 (11804)

🏷️ 熱門標籤

AI Agent 1324 AI 智能体 734 Claude Code 645 Anthropic 622 LLM 563 AI 编程 501 OpenClaw 498 开源 439 AI 安全 396 AI 396 Claude 384 OpenAI 362 软件工程 354 开发者工具 343 生产力 308 GitHub 251 自动化 238 AI 基础设施 227 AI 开发 225 MCP 223
港中文薛天帆团队:实现 4K 全景视频生成,普通视频也能「长出空间」
📌 一句话摘要 香港中文大学薛天帆团队提出 CubeComposer 框架,通过时空自回归技术将普通视角视频扩展为高质量 4K 360° 全景视频,显著降低了沉浸式内容的制作门槛。 📝 详细摘要 本文介绍了香港中文大学薛天帆团队在 CVPR 2026 发表的 CubeComposer 研究成果。
📅 2026-04-07 18:19 (8 天前) AI科技评论 人工智能 9 分鐘 ★ 85
AI 视频生成 全景视频 CVPR 2026 CubeComposer
让大模型多模态检索全面超越 SOTA!ReCALL 框架化解生成式与判别式的范式冲突|CVPR’26
📌 一句话摘要 ReCALL 框架通过「诊断-生成-校准」闭环体系,解决了多模态大模型在检索任务中的范式冲突与能力退化问题,在 CIRR 等基准测试中刷新 SOTA。 📝 详细摘要 本文介绍了由紫东太初团队与新加坡国立大学联合提出的 ReCALL 框架,旨在解决多模态大模型(MLLM)在执行组合
📅 2026-04-06 23:30 (9 天前) 听雨 人工智能 1 分鐘 ★ 91
多模态大模型 图像检索 CIR ReCALL
中山大学梁小丹团队论文:让视频生成从「看起来真实」到「物理上正确」丨 CVPR 2026
📌 一句话摘要 中山大学梁小丹团队在 CVPR 2026 发表 ProPhy 框架,通过引入语义级与空间级分层物理建模,并利用 VLM 进行监督,有效解决了视频生成模型视觉真实但物理逻辑缺失的问题。 📝 详细摘要 本文介绍了中山大学梁小丹团队在 CVPR 2026 发表的论文《ProPhy: P
📅 2026-03-26 18:09 (20 天前) AI科技评论 人工智能 2 分鐘 ★ 88
CVPR 2026 视频生成 物理模拟 ProPhy
CVPR 2026 | 中科院、港中文等提出 HiFi-Inpaint:无损还原物体细节,重塑 Inpainting 生成范式!
📌 一句话摘要 中科院与港中文团队提出 HiFi-Inpaint 模型,通过显式高频特征引导机制解决电商场景「人+商品」图像生成中的细节丢失难题,已被 CVPR 2026 接收。 📝 详细摘要 本文介绍了一个针对电商场景的高保真图像修复模型 HiFi-Inpaint。现有扩散模型在生成「人+商品
📅 2026-03-22 13:31 (25 天前) 机器之心 人工智能 2 分鐘 ★ 87
HiFi-Inpaint 图像修复 CVPR 2026 扩散模型
浙大团队破解多模态模型「盲目自信」:先校准置信度,再分配算力丨 CVPR’26
📌 一句话摘要 浙江大学等团队提出 CA-TTS 框架,通过置信度驱动的强化学习校准多模态模型的自我评估能力,并将校准后的置信度转化为推理资源分配信号,在四大视觉推理基准上全面达到 SOTA。 📝 详细摘要 本文介绍了浙江大学联合阿里巴巴、香港城市大学、密歇根大学研究团队在 CVPR 2026
📅 2026-03-22 15:17 (25 天前) 听雨 人工智能 12 分鐘 ★ 91
多模态大模型 置信度校准 CVPR 2026 CA-TTS
精准识别「界门纲目科属种」!北大彭宇新团队用细粒度树先验提升泛化,破解生物类别分层识别难题
📌 一句话摘要 北京大学彭宇新团队提出 TARA 方法,通过将多模态大模型与生物基础模型进行表征对齐,成功将类别树知识注入模型,解决了生物分层识别中的逻辑一致性与新类泛化难题。 📝 详细摘要 本文介绍了北京大学彭宇新教授团队在细粒度多模态大模型领域的最新研究成果——TARA(分类感知表征对齐方法
📅 2026-03-21 17:48 (25 天前) 衡宇 人工智能 13 分鐘 ★ 88
多模态大模型 分层视觉识别 生物分类学 表征对齐
浙大&腾讯打破图像编辑「规模-质量」魔咒:1000 万数据+统一验证框架,让开源模型追上闭源 SOTA | CVPR 2026
📌 一句话摘要 浙大与腾讯联合发布 CVPR 2026 论文,推出 1000 万样本的 UnicEdit-10M 数据集和 UnicBench 评估基准,通过「质检+改题」双系统解决开源图像编辑模型与闭源模型之间的规模-质量差距问题。 📝 详细摘要 本文介绍了浙江大学与腾讯在 CVPR 2026
📅 2026-03-20 18:12 (26 天前) AI科技评论 人工智能 8 分鐘 ★ 82
计算机视觉 图像编辑 数据集构建 CVPR 2026
CVPR2026 | Streamo:让大模型变成实时流式交互助手
📌 一句话摘要 Streamo 是一个端到端视频大模型框架,通过将“响应时机”转化为 Token 预测,实现了流式视频的实时交互与决策统一。 📝 详细摘要 本文介绍了香港浸会大学与腾讯优图实验室联合提出的 Streamo 框架,旨在解决现有视频大模型在处理无界流式视频时“决策与生成分离”的痛点。
📅 2026-03-19 14:46 (28 天前) 机器之心 人工智能 5 分鐘 ★ 87
视频大模型 流式交互 Streamo CVPR 2026