📡 Poller 最後抓取: 14 分鐘前 (06-09 02:00)
BestBlogs 精選 (21656)
🏷️ 熱門標籤
● 阿里 RTPurboV2:原生 Transformer 再次崛起,百步训练实现 10 倍稀疏注意
📅 2026-06-08 10:07 (16 小時前) 机器之心 人工智能 2 分鐘 ★ 88
● 超越 TurboQuant,面向长上下文推理的真 2-bit KV Quantization 算法问世
● 超越 TurboQuant! OSCAR:面向真实 Serving 的 2bit KV Cache 量化
📅 2026-05-29 14:00 (10 天前) InfoQ 中文 人工智能 2 分鐘 ★ 88
● 万字入门 AI Infra:深入理解大模型中的数学与 Infra 优化
● AI Infra 入门干货总结:大模型是如何高效推理的
📅 2026-05-25 17:36 (14 天前) 腾讯技术工程 人工智能 2 分鐘 ★ 90
● 下一代大模型推理网络架构:ZCube 如何有效破解网络瓶颈?
● 从 P(y|x) 到 P(y):将 RL 引入预训练空间,激发大模型内生推理
● 高并发下大模型降智力?范式团队刚刚修复了 vLLM 一个隐藏极深的“吞 Token”大坑
● AI Infra 其实没有多少新东西
● #515. GPT-5、Claude 和 Gemini 的是如何训练与部署的
📅 2026-04-30 18:48 (04-30 18:48) 跨国串门儿计划 人工智能 2 分鐘 ★ 87
● DeepSeek 不惜代价保住它!V4 关键特性被挖出来了
📅 2026-04-28 14:15 (04-28 14:15) 鱼羊 人工智能 2 分鐘 ★ 87
● DeepSeek 不惜代价保住它!V4 关键特性被挖出来了
📅 2026-04-28 14:15 (04-28 14:15) 鱼羊 人工智能 2 分鐘 ★ 87
● 普通网线也能跑万亿大模型!月之暗面抛出王炸架构,亲证:不用全买 H100!1T 模型实测:延迟暴降 64%!大模型推理“围城”攻破了!
● Kimi 新论文:把 KVCache 玩成新商业模式了
📅 2026-04-19 18:19 (04-19 18:19) 衡宇 人工智能 2 分鐘 ★ 91
● Life of a Token:像调试代码一样看懂大模型如何生成 Token
📅 2026-04-17 15:31 (04-17 15:31) AI前线 人工智能 29 分鐘 ★ 92
● 北大团队改造 DeepSeek 注意力,速度快四倍还不丢精度
● Gemma 4 架构可视化指南
📅 2026-04-05 20:27 (04-05 20:27) Philipp Schmid 人工智能 3 分鐘 ★ 82
● Google 为 Gemini API 引入 Flex 和 Priority 服务层级
📅 2026-04-03 04:03 (04-03 04:03) Logan Kilpatrick 人工智能 1 分鐘 ★ 86
● 推荐:TurboQuant KV Cache 压缩技术解析
📅 2026-03-26 19:25 (03-26 19:25) Mr Panda 人工智能 1 分鐘 ★ 86
● 一个用于探索奖励推理的玩具环境 — LessWrong