全部 未讀 (21598) ★ 收藏 (0) 🤖 人工智能 (11165) 📊 商业科技 (4460) 💻 软件编程 (1685) 📁 个人成长 (1604) 📁 生活文化 (856) 📁 媒体资讯 (817) 📁 投资财经 (529) 🎨 产品设计 (408) 📁 AI 产品 (39) 📁 体育运动 (27)
篩選中: 🏷️ 模型训练与推理 共 8 篇 ✕ 清除篩選
21600
全部文章
21598
未讀
187
今日新增
0
收藏
📡 Poller 最後抓取: 1 小時前 (06-08 18:00)
BestBlogs 精選 (21565)

🏷️ 熱門標籤

AI Agent 2155 AI 编程 984 Anthropic 981 Claude Code 916 AI 智能体 780 OpenAI 745 LLM 674 开源 574 OpenClaw 557 Claude 557 AI 517 AI 安全 490 开发者工具 432 Codex 416 软件工程 398 具身智能 334 Agent 334 个人成长 331 GitHub 321 生产力 315
上海 AI Lab 最新开源 AgentDoG 1.5:面向完整执行轨迹的轻量可扩展 Agent 安全框架
📌 一句话摘要 上海 AI Lab 开源 AgentDoG 1.5,将 Agent 安全判断从单次回复推进到完整执行轨迹,提供评测、数据生成与轻量部署的一体化框架。 📝 详细摘要 文章介绍上海 AI Lab 最新开源的 AgentDoG 1.5 框架,核心思路是将 Agent 安全判断对象从单次
📅 2026-06-07 00:00 (1 天前) 青稞AI 人工智能 2 分鐘 ★ 86
AI Agent AI 安全 LLM 模型训练与推理
模型也需要「睡觉」?CMU 新论文让 LLM 在梦中「巩固记忆」
📌 一句话摘要 CMU 新论文提出一种类似睡眠的「记忆巩固机制」,让 LLM 在离线阶段递归处理上下文,将关键信息转化为快速权重,以提升长程推理能力。 📝 详细摘要 文章介绍了卡内基梅隆大学与马里兰大学等机构联合发表的一篇论文《Language Models Need Sleep》。论文指出,随
📅 2026-06-05 12:07 (3 天前) 机器之心 人工智能 2 分鐘 ★ 82
LLM AI 研究 长上下文 记忆机制
Token 必须死?
📌 一句话摘要 本文从维特根斯坦的语言哲学切入,结合何恺明团队与字节 Seed 的最新论文,论证逐 token 预测范式存在结构性天花板,并梳理了 Google、OpenAI、Anthropic 等巨头在连续空间建模方向上的战略布局。 📝 详细摘要 文章以「Token 必须死?」为标题,系统探讨
📅 2026-06-04 17:20 (4 天前) 腾讯研究院 人工智能 2 分鐘 ★ 88
LLM AI Agent 多模态AI 模型训练与推理
Nature:大模型的潜意识学习引发行为偏好传递风险
📌 一句话摘要 本文解读 Nature 论文,揭示大模型训练中教师模型可通过数字、代码等语义无关信号向学生模型传递行为偏好,即「潜意识学习」,对 AI 安全构成新挑战。 📝 详细摘要 文章围绕 Anthropic、Truthful AI 及 UC Berkeley 联合发表在 Nature 上的
📅 2026-06-04 14:30 (4 天前) 集智俱乐部 人工智能 2 分鐘 ★ 86
LLM AI 安全与对齐 模型训练与推理 Nature
一个 GPT Plus 会员的钱,够机器人跑一个月世界模型了
📌 一句话摘要 智在无界发布隐式世界模型 Being-H-Flash,在百 TOPS 端侧芯片上实现实时运行,月度算力成本降至 150 元,仅为英伟达 Cosmos 方案的 2%。 📝 详细摘要 文章报道了智在无界(BeingBeyond)发布的隐式世界模型产品 Being-H-Flash。核心
📅 2026-06-04 11:10 (4 天前) henry 人工智能 2 分鐘 ★ 86
具身智能 世界模型 AI Agent 机器人
不用地图也能规划公交路线?| TransitLM:首个大规模端到端公交路线生成数据集与基准
📌 一句话摘要 高德地图提出 TransitLM,通过将 12 万公交站点注册为独立 token 并在 1300 万条路线数据上微调 4B 模型,实现了无需地图基础设施的端到端公交路线生成,性能持平生产级路径引擎。 📝 详细摘要 本文介绍了高德地图团队提出的 TransitLM,一种无需地图基础
📅 2026-06-03 16:35 (5 天前) 魔搭ModelScope社区 人工智能 2 分鐘 ★ 88
LLM AI Agent 模型训练与推理 AI 产品与应用
吃透大模型 SFT 底层机理:终结实践争议,规避无效算力
📌 一句话摘要 本文从交互机理的底层视角,论证了在高度同源数据上对 LLM 进行 SFT 的有效窗口极短,主要作用是短暂去噪而非持续学习,并提出了基于交互机理质量监控的 early stopping 方法以规避无效算力。 📝 详细摘要 文章围绕大语言模型监督微调(SFT)的争议展开,提出一个核心
📅 2026-06-03 15:30 (5 天前) 机器之心 人工智能 2 分鐘 ★ 87
LLM SFT 模型训练与推理 AI 安全与对齐
96.33% 新 SOTA!PaddleOCR-VL-1.6 发布,大模型时代的数据基座再升级
📌 一句话摘要 PaddleOCR-VL-1.6 发布,通过模型驱动的数据引擎与渐进式后训练策略,在 OmniDocBench v1.6 上以 96.33% 刷新 SOTA,模型结构与 v1.5 完全一致,零成本升级。 📝 详细摘要 本文是 PaddleOCR-VL-1.6 的版本发布公告。文章
📅 2026-06-02 16:30 (6 天前) 魔搭ModelScope社区 人工智能 2 分鐘 ★ 84
OCR 文档解析 模型发布 多模态 AI