全部 未讀 (21557) ★ 收藏 (0) 🤖 人工智能 (11159) 📊 商业科技 (4458) 💻 软件编程 (1684) 📁 个人成长 (1603) 📁 生活文化 (850) 📁 媒体资讯 (797) 📁 投资财经 (526) 🎨 产品设计 (406) 📁 AI 产品 (39) 📁 体育运动 (27)
篩選中: 🏷️ 大语言模型 共 159 篇 ✕ 清除篩選
21559
全部文章
21557
未讀
146
今日新增
0
收藏
📡 Poller 最後抓取: 1 小時前 (06-08 16:00)
BestBlogs 精選 (21524)

🏷️ 熱門標籤

AI Agent 2149 AI 编程 983 Anthropic 981 Claude Code 916 AI 智能体 780 OpenAI 745 LLM 672 开源 574 OpenClaw 557 Claude 557 AI 517 AI 安全 490 开发者工具 432 Codex 416 软件工程 398 具身智能 334 Agent 334 个人成长 328 GitHub 321 生产力 315
腾讯姚顺雨:AI 下半场最重要的事,保持耐心
📌 一句话摘要 腾讯混元大模型负责人姚顺雨与腾讯高级执行副总裁汤道生深度对谈,系统阐释 AI 下半场的核心是「寻找好问题」而非「寻找好方法」,强调实用性大于刷榜、模型与产品 Co-Design 建立信任、以及保持耐心做长期游戏。 📝 详细摘要 本文是 2026 年腾讯云 AI 产业应用大会上,腾
📅 2026-06-05 21:35 (2 天前) 笔记侠 人工智能 2 分鐘 ★ 88
AI Agent 大语言模型 AI产品设计 Co-Design
MiniMax M3:前沿 Coding 能力、1M 上下文、原生多模态,一个模型全给你
📌 一句话摘要 MiniMax 发布 M3 模型,集前沿 Coding 能力、1M 超长上下文和原生多模态于一体,是国内首个齐备这些要素的模型,并已开源。 📝 详细摘要 MiniMax 正式发布 M3 模型,这是国内首个同时具备前沿编程能力、1M 超长上下文和原生多模态能力的模型,也是目前唯一的
📅 2026-06-01 09:24 (7 天前) MiniMax 稀宇科技 人工智能 2 分鐘 ★ 93
MiniMax M3 大语言模型 多模态 Coding
「Token」必须死?
📌 一句话摘要 本文深入探讨了基于离散 Token 的自回归大语言模型在通往 AGI 道路上的结构性天花板,并结合何恺明团队 ELF、字节 Cola DLM 等最新研究,论证了连续空间建模作为下一代范式的可能性。 📝 详细摘要 文章以维特根斯坦的语言哲学为引,指出大语言模型基于离散 Token
📅 2026-05-30 17:00 (9 天前) 36氪 人工智能 2 分鐘 ★ 88
Token 大语言模型 AGI 连续空间
Claude Opus 4.8 发布:不是 Mythos,但已经很近了
📌 一句话摘要 Anthropic 发布 Claude Opus 4.8,带来小幅但切实的模型能力提升,同时推出 Claude Code Dynamic Workflows 和 API effort 参数,为后续 Mythos 模型铺路。 📝 详细摘要 文章详细解读了 Anthropic 最新发
📅 2026-05-29 10:49 (10 天前) AINLP 人工智能 2 分鐘 ★ 86
Claude Opus 4.8 Anthropic 大语言模型 AI Agent
AI 为什么会“失语”?
📌 一句话摘要 本文深入剖析了 AI 模型「失语」现象(如无法说出「马嘉祺」),将其归因于后训练阶段对低频 token 的灾难性遗忘,并借人类「舌尖现象」进行类比分析。 📝 详细摘要 文章以 MiniMax 模型无法正确输出「马嘉祺」这一现象为切入点,系统分析了 AI 模型的一种新型故障——「失
📅 2026-05-29 16:30 (10 天前) 腾讯研究院 人工智能 2 分鐘 ★ 88
大语言模型 失语 灾难性遗忘 分词器
重磅!Claude Opus 4.8 来了:价格不变、更诚实、一次可调动上百 AI Agent!
📌 一句话摘要 Anthropic 发布 Claude Opus 4.8,重点提升模型可靠性、诚实性和智能体场景效率,并推出可调度数百个子智能体的 Dynamic Workflows 功能。 📝 详细摘要 文章报道了 Anthropic 发布 Claude Opus 4.8 的消息。此次更新距离
📅 2026-05-29 17:09 (10 天前) CSDN 人工智能 2 分鐘 ★ 85
Claude Opus 4.8 Anthropic 大语言模型 AI Agent
实测 Claude Opus 4.8,这可能是第一个不会偷懒的模型。
📌 一句话摘要 本文实测了 Claude Opus 4.8,认为其在开发编程上进步显著,更精确、更诚实、不偷懒,但创作能力仍不如 Opus 4.6,且主动性变弱,对非专业用户可能不友好。 📝 详细摘要 文章作者在 Claude Opus 4.8 上线后第一时间进行了实测和深度体验。文章首先介绍了
📅 2026-05-29 06:06 (10 天前) 数字生命卡兹克 人工智能 2 分鐘 ★ 87
Claude Opus 4.8 模型评测 AI 编程 Anthropic
Claude 4.8 炸场!部分能力超过 Mythos,支持数百子智能体并行
📌 一句话摘要 Anthropic 发布 Claude Opus 4.8,在终端工程、知识工作和诚实性上有显著提升,并推出支持数百子智能体并行的动态工作流功能。 📝 详细摘要 Anthropic 发布了 Claude 最新旗舰模型 Opus 4.8,距离上一版仅 43 天。该模型在终端工程能力和
📅 2026-05-29 07:57 (10 天前) 梦晨 人工智能 2 分鐘 ★ 88
Claude Opus 4.8 Anthropic 大语言模型 动态工作流
Gemma 4 多词元预测:生成速度最高提升约 3 倍
📌 一句话摘要 Gemma 4 通过多词元预测(MTP)草稿模型与投机解码技术,在单次前向传播中并行生成并校验多个词元,实现最高约 3 倍的推理加速,且不损失输出质量。 📝 详细摘要 本文介绍了 Google 推出的 Gemma 4 模型与多词元预测(MTP)草稿模型协同工作的技术原理与优势。M
📅 2026-05-28 16:35 (11 天前) InfoQ 中文 人工智能 2 分鐘 ★ 85
Gemma 4 多词元预测 投机解码 推理加速
“Token”必须死?
📌 一句话摘要 本文深入探讨了当前大语言模型基于 token 预测范式的结构性天花板,并结合何恺明团队 ELF、字节跳动 Cola DLM 等最新研究,论证了向连续空间建模迁移的必然趋势,以及其对 AI 行业格局的潜在影响。 📝 详细摘要 文章以维特根斯坦的哲学观点为引,指出大语言模型基于离散
📅 2026-05-28 07:45 (11 天前) 人人都是产品经理 人工智能 2 分鐘 ★ 88
大语言模型 Tokenization 连续空间建模 AGI
Gemma 4 留言板|真实用户反馈
📌 一句话摘要 本文汇总了 Google 开发者社区用户对 Gemma 4 模型在代码生成、多模态理解、端侧部署等场景的真实使用反馈,展示了其在实际应用中的表现与用户评价。 📝 详细摘要 本文是 Google 官方发布的一篇用户反馈合集,旨在通过真实用户的使用体验来展示 Gemma 4 模型的能
📅 2026-05-26 17:30 (13 天前) 谷歌开发者 人工智能 2 分鐘 ★ 80
Gemma 4 Google AI 大语言模型 用户反馈
刚刚,国产 Agent 模型闯入全球第一梯队!限时免费
📌 一句话摘要 昆仑万维发布 SkyClaw-v1.0 系列 Agent 模型,以原生 Agent 训练路线实现性能跻身全球第一梯队,价格仅为主流顶尖模型一半,并限时免费开放。 📝 详细摘要 本文介绍了昆仑万维最新发布的 SkyClaw-v1.0 及轻量版 SkyClaw-v1.0-lite A
📅 2026-05-26 12:13 (13 天前) 一水 人工智能 2 分鐘 ★ 85
昆仑万维 SkyClaw Agent 模型 大语言模型
“Token”必须死?
📌 一句话摘要 本文深入探讨了基于 Token 的自回归大语言模型的结构性天花板,并介绍了何恺明团队 ELF 和字节跳动 Cola DLM 等将语言生成核心计算迁移至连续空间的最新研究,预示着 AI 范式可能正在发生转变。 📝 详细摘要 文章从维特根斯坦的语言哲学出发,指出大语言模型基于离散 T
📅 2026-05-25 22:03 (13 天前) 虎嗅APP 人工智能 2 分鐘 ★ 88
大语言模型 Tokenization 连续空间 AGI
王建硕:Markdown,是新时代的编程语言
📌 一句话摘要 王建硕提出自然语言是新的“汇编”,LLM 是新的编译器,程序员应彻底放弃直接修改 AI 生成的代码,转而在更上层的自然语言层编写可重复执行的工程。 📝 详细摘要 本期播客中,嘉宾王建硕(百姓网创始人)与主持人徐文浩展开了一场关于 AI 时代编程本质的深度交锋。王建硕的核心论点清晰
📅 2026-05-25 21:02 (13 天前) 徐文浩,任鑫 人工智能 2 分鐘 ★ 90
自然语言编程 大语言模型 Vibe Coding AI 赋能开发
刚刚, GLM-5.1 高速版来了,真的太快快快快快了。
📌 一句话摘要 本文测评了智谱最新发布的 GLM-5.1-HighSpeed 高速版模型,其以每秒 400 token 的速度在保持旗舰模型智能水平的同时大幅提升推理效率,并深入解析了背后的 TileRT 推理引擎技术。 📝 详细摘要 文章围绕智谱最新发布的 GLM-5.1-HighSpeed
📅 2026-05-22 11:52 (17 天前) 逛逛GitHub 人工智能 2 分鐘 ★ 86
GLM-5.1 智谱 大语言模型 推理加速
李建忠对话菲尔兹奖得主 Timothy Gowers:整个数学研究的范式将被 AI 改变
📌 一句话摘要 菲尔兹奖得主 Timothy Gowers 在与李建忠的对话中,深入探讨了 AI 将彻底改变数学研究范式、模式匹配与逻辑推理的界限模糊、以及数学教育在 AI 时代的新价值等核心议题。 📝 详细摘要 本文是奇点智能研究院院长李建忠与菲尔兹奖得主 Timothy Gowers 教授在
📅 2026-05-20 12:00 (19 天前) AI科技大本营 人工智能 2 分鐘 ★ 86
Timothy Gowers 菲尔兹奖 AI 数学 数学研究
千问正式发布 Qwen3.7-Max
📌 一句话摘要 千问发布面向智能体时代的新一代旗舰模型 Qwen3.7-Max,在编程、办公自动化、长周期自主执行等多项基准测试中取得领先表现,并通过环境扩展和跨框架泛化能力强化其智能体底座定位。 📝 详细摘要 千问正式发布 Qwen3.7-Max,定位为面向智能体时代的全能旗舰模型。文章详细介
📅 2026-05-20 11:36 (19 天前) 阿里研究院 人工智能 2 分鐘 ★ 87
Qwen3.7-Max 千问 智能体 大语言模型
ICLR 2026 | 800 条数据治愈“过度思考”,大模型 CoT 减半还更准
📌 一句话摘要 中科大团队提出 LCPO 方法,仅用 800 条数据和 50 步训练,即可将大模型推理长度减半,同时保持甚至提升准确率,已被 ICLR 2026 接收。 📝 详细摘要 本文介绍了中科大团队被 ICLR 2026 接收的新工作 LCPO(Length Controlled Pref
📅 2026-05-20 13:07 (19 天前) PaperWeekly 人工智能 2 分鐘 ★ 86
大语言模型 推理模型 CoT 过度思考
今日开源(2026-5-20):NVIDIA 发布 Nemotron-Labs-Diffusion,三模式大语言模型支持 AR/扩散并行/自推测解码无缝切换
📌 一句话摘要 本文汇总了 2026 年 5 月 20 日发布的 6 个开源 AI 项目,涵盖 NVIDIA 三模式大语言模型、视频多模态模型、分层推理模型以及音视频工具等。 📝 详细摘要 文章以每日开源项目汇总的形式,介绍了 6 个最新发布的开源 AI 项目。核心项目包括 NVIDIA 的 N
📅 2026-05-20 18:30 (18 天前) 机器之心SOTA模型 人工智能 2 分鐘 ★ 80
开源项目 大语言模型 视频多模态 NVIDIA
突发!OpenAI 创始成员 Andrej Karpathy 加入 Anthropic
📌 一句话摘要 OpenAI 创始成员、前特斯拉 AI 负责人 Andrej Karpathy 宣布加入 Anthropic,重返一线研发,此举被视为 LLM 前沿竞争加剧的重要信号。 📝 详细摘要 本文报道了 Andrej Karpathy 加入 Anthropic 的消息。Karpathy
📅 2026-05-20 00:11 (19 天前) AI前线 人工智能 2 分鐘 ★ 82
Andrej Karpathy Anthropic OpenAI AI 人才流动