全部 未讀 (21615) ★ 收藏 (0) 🤖 人工智能 (11168) 📊 商业科技 (4461) 💻 软件编程 (1685) 📁 个人成长 (1605) 📁 生活文化 (857) 📁 媒体资讯 (827) 📁 投资财经 (529) 🎨 产品设计 (408) 📁 AI 产品 (39) 📁 体育运动 (28)
篩選中: 🏷️ 多模态AI 共 9 篇 ✕ 清除篩選
21617
全部文章
21615
未讀
204
今日新增
0
收藏
📡 Poller 最後抓取: 27 分鐘前 (06-08 20:00)
BestBlogs 精選 (21582)

🏷️ 熱門標籤

AI Agent 2157 AI 编程 985 Anthropic 981 Claude Code 916 AI 智能体 780 OpenAI 745 LLM 674 开源 574 OpenClaw 557 Claude 557 AI 517 AI 安全 490 开发者工具 432 Codex 416 软件工程 398 具身智能 334 Agent 334 个人成长 331 GitHub 321 生产力 315
Token 必须死?
📌 一句话摘要 本文从维特根斯坦的语言哲学切入,结合何恺明团队与字节 Seed 的最新论文,论证逐 token 预测范式存在结构性天花板,并梳理了 Google、OpenAI、Anthropic 等巨头在连续空间建模方向上的战略布局。 📝 详细摘要 文章以「Token 必须死?」为标题,系统探讨
📅 2026-06-04 17:20 (4 天前) 腾讯研究院 人工智能 2 分鐘 ★ 88
LLM AI Agent 多模态AI 模型训练与推理
戴盟机器人完成亿元融资,阿里通义多模态大牛加盟攻关物理世界模型
📌 一句话摘要 戴盟机器人完成亿元 A 轮融资,并引入阿里通义前多模态专家原玮浩,以触觉模态为核心攻关物理世界模型,试图补齐具身智能在真实物理交互中的关键数据缺口。 📝 详细摘要 本文报道了具身智能公司戴盟机器人完成亿元 A 轮融资的消息,投资方为汇川产投和中国电信。文章重点介绍了戴盟的技术路线
📅 2026-06-04 11:06 (4 天前) 衡宇 人工智能 2 分鐘 ★ 84
具身智能 机器人 AI Agent 多模态AI
MiniMax M3 一手实测:老黄 PPT 上 74 个 Logo,我以为能难住它
📌 一句话摘要 本文通过复现论文、识别 PPT Logo、制作打卡地图和讲解语言学奥赛视频等实测,验证了 MiniMax M3 在长上下文、多模态和 Coding 三大能力上的综合表现,认为其已进入全球第一梯队。 📝 详细摘要 文章围绕 MiniMax 最新开源的旗舰模型 M3 展开,重点评测其
📅 2026-06-02 23:50 (5 天前) 克雷西 人工智能 2 分鐘 ★ 87
AI模型 LLM 多模态AI AI编程
GPT Image 2 一出,你看到的每张图都值得怀疑
📌 一句话摘要 本文报道了 OpenAI 最新图像生成模型 GPT Image 2 的发布,通过大量示例展示了其在照片级写实、精准文字渲染、复杂逻辑理解等方面的突破性能力,并探讨了其对设计、游戏、影视等行业以及互联网信任体系带来的颠覆性影响。 📝 详细摘要 文章详细介绍了 OpenAI 最新发布
📅 2026-04-23 11:53 (04-23 11:53) 经纬创投 人工智能 2 分鐘 ★ 84
GPT Image 2 OpenAI 图像生成 AIGC
一文读懂 ChatGPT Images 2.0:图像 AI 的下一个阶段
📌 一句话摘要 本文编译介绍了 OpenAI 最新发布的 ChatGPT Images 2.0 图像生成模型,重点分析了其在指令理解、多语言文字渲染、风格还原、多图一致性输出以及跨平台尺寸适配等方面的系统性升级,并探讨了其从工具向视觉工作系统的转变意义。 📝 详细摘要 文章编译自 OpenAI
📅 2026-04-22 21:31 (04-22 21:31) 白鲸出海 人工智能 2 分鐘 ★ 84
ChatGPT Images 2.0 OpenAI 图像生成 多模态AI
OpenAI 发布 GPT-Image-2:设计师们的饭碗,可能要真的没了
📌 一句话摘要 本文详细介绍了 OpenAI 最新发布的图像生成模型 GPT-Image-2,通过多个实测场景展示了其在策略性思考、多语言排版、角色一致性、微观控制等方面的突破性能力,并分析了其技术架构、定价策略及对设计行业的潜在颠覆性影响。 📝 详细摘要 文章深度解析了 OpenAI 最新发布
📅 2026-04-22 08:03 (04-22 08:03) 创业邦 人工智能 2 分鐘 ★ 88
GPT-Image-2 OpenAI 图像生成 多模态AI
Visual Agent 是什么?聊聊 Context Awareness 和 Visual Agent,Physical AI Camp 杭州站
📌 一句话摘要 本文是一篇关于即将在杭州举办的 RTE Meetup 活动预告,聚焦于 Visual Agent(视觉智能体)和 Context Awareness(上下文感知)技术,邀请了多家公司的技术专家分享从技术底座到产品落地的思考。 📝 详细摘要 文章预告了将于 2026 年 4 月 2
📅 2026-04-21 15:51 (04-21 15:51) 魔搭ModelScope社区 人工智能 2 分鐘 ★ 79
Visual Agent Context Awareness 多模态AI Physical AI
AI 模型无法读取高中教材基本图表:CMU DIAGRAMMA 基准测试揭示关键缺陷
📌 一句话摘要 CMU 的 DIAGRAMMA 基准测试显示,包括 GPT-4o、Claude 和 Gemini 在内的主流 AI 模型在读取科学图表方面全部失败,最佳模型得分仅为 59.64%。 📝 详细摘要 这条推文报道了 CMU DIAGRAMMA 基准测试的一项重要发现。该测试对 17
📅 2026-03-21 19:18 (03-21 19:18) God of Prompt 人工智能 2 分鐘 ★ 78
AI基准测试 DIAGRAMMA 多模态AI 图表理解
刚刚,全球视频模型新王诞生了!
📌 一句话摘要 天工 AI 发布的视频生成模型 SkyReels-V4 登顶全球榜单,通过强化学习和多模态架构升级,实现了从片段生成向工业化视频生产的跨越。 📝 详细摘要 文章报道了天工 AI(昆仑万维)推出的 SkyReels-V4 模型在 Artificial Analysis 文转视频榜单
📅 2026-03-19 14:55 (03-19 14:55) 一水 人工智能 6 分鐘 ★ 75
SkyReels-V4 视频生成模型 强化学习 MMDiT架构