📡 Poller 最後抓取: 1 小時前 (06-09 00:00)
BestBlogs 精選 (21638)
🏷️ 熱門標籤
● 超越 TurboQuant! OSCAR:面向真实 Serving 的 2-bit KV Cache 量化
● Latent Space 综述:模型的「内心独白」从 Token 搬回向量,是 LLM 进化的下一拍
📅 2026-05-03 11:32 (05-03 11:32) 李继刚 人工智能 1 分鐘 ★ 88
● 强化学习的进化:从 PPO 到 MaxRL,LLM 推理训练的算法演进史
● ACL 2026|答得更准还写得更短?华为泰勒实验室提出 SHAPE,给 LLM 推理装了个「推理税」
● DHH 推荐:通过 Fireworks AI 使用 Kimi 实现 200tps+ 极速体验
📅 2026-04-21 12:02 (04-21 12:02) Ding 人工智能 1 分鐘 ★ 82
● AI 能力怀疑论中不断移动的球门柱
● DeepLearning.AI 推出 SGLang 高效推理免费课程
📅 2026-04-08 23:31 (04-08 23:31) DeepLearning.AI 人工智能 1 分鐘 ★ 87
● 斯坦福最新研究:单智能体 vs 多智能体效率大比拼
● Claude Code 性能退化争议:AMD AI 主管量化分析与 Anthropic 官方回应
📅 2026-04-07 13:34 (04-07 13:34) AI前线 人工智能 2 分鐘 ★ 86
● “Claude Code 更新废了”!热议 Issue:思考深度下降 67%,已无法胜任复杂的工程任务
📅 2026-04-07 14:13 (04-07 14:13) 西风 人工智能 7 分鐘 ★ 90
● 通过推测解码将 LLM 推理延迟降低 10 倍
● 昆仑芯大规模 LLM 推理优化,实现秒级扩缩容
● 谷歌 TurboQuant 论文:KV cache 压缩 6 倍且精度零损失
📅 2026-03-26 11:03 (03-26 11:03) 梦晨 人工智能 11 分鐘 ★ 90
● 🔬 为什么还没有“材料界的 AlphaFold” —— 专访 Heather Kulik 谈 AI 材料发现
📅 2026-03-25 00:53 (03-25 00:53) Brandon Anderson, RJ Honicky 人工智能 2 分鐘 ★ 89
● **介绍 SPEED-Bench:一个用于推测解码的统一且多样化的基准测试**
● 自动研究:利用 Apple 的“LLM in a Flash”在本地运行 Qwen 397B
📅 2026-03-19 07:56 (03-19 07:56) Simon Willison 人工智能 2 分鐘 ★ 84
● 英伟达称其可在不改变模型权重的情况下将 LLM 记忆缩小 20 倍
● 为什么要在乎 LLM 中的提示词缓存?
● Fireworks AI 高性能推理现已登陆 Microsoft Azure
📅 2026-03-12 03:23 (03-12 03:23) elvis 人工智能 4 分鐘 ★ 81
● V1:统一并行推理器的生成与自我验证