📡 Poller 最後抓取: 1 小時前 (06-08 20:00)
BestBlogs 精選 (21582)
🏷️ 熱門標籤
● ICML 2026|首个视觉语言模型并行思考框架,一文解析内在机制
● ACL 2026|多模态大模型是“看错”还是“想错”?浙大 VL-Calibration 让模型学会校准自信
● 今日开源(2026-5-15):Motif-Video 正式开源,20 亿参数文生视频/图生视频扩散 Transformer 模型,VBench 开源模型最高分 83.76%
📅 2026-05-15 18:30 (24 天前) 机器之心SOTA模型 人工智能 2 分鐘 ★ 80
● 今日开源(2026-4-27):谷歌开源 TIPSv2 模型,对比学习框架驱动图像文本特征对齐,覆盖零样本分类应用场景
● Mano-P:纯视觉 GUI-VLA 智能体,一句话操控桌面软件
● 团队赢得最佳边缘 AI 奖:火星探索 VLM 多探测车系统
● LFM2.5-VL 多语言视觉模型上线,函数调用与 9 语支持拓宽通用视觉任务边界
● ICLR 2026 | 机器人不够聪明?VLMgineer 让大模型自己「发明工具」,从设计到使用全自动
● Feynman:应对 VLM 挑战的知识注入式图表智能体
● NanoVDR:将 2B 视觉语言模型蒸馏为 70M 纯文本编码器
● CVPR'26 | 以机器人为中心的 ToM 推理框架,从心智推理到决策行动
📅 2026-03-15 12:28 (03-15 12:28) 新智元 人工智能 9 分鐘 ★ 86
● 视觉语言模型如何从“零”开始训练
📅 2026-03-14 00:30 (03-14 00:30) Avishek Biswas 人工智能 2 分鐘 ★ 83
● MM-Zero:零数据下的自进化多模态视觉语言模型