全部 未讀 (21671) ★ 收藏 (0) 🤖 人工智能 (11190) 📊 商业科技 (4470) 💻 软件编程 (1687) 📁 个人成长 (1607) 📁 生活文化 (864) 📁 媒体资讯 (833) 📁 投资财经 (536) 🎨 产品设计 (409) 📁 AI 产品 (39) 📁 体育运动 (28)
篩選中: 🏷️ 稀疏注意力 共 12 篇 ✕ 清除篩選
21673
全部文章
21671
未讀
35
今日新增
0
收藏
📡 Poller 最後抓取: 32 分鐘前 (06-09 00:00)
BestBlogs 精選 (21638)

🏷️ 熱門標籤

AI Agent 2168 AI 编程 991 Anthropic 981 Claude Code 917 AI 智能体 780 OpenAI 745 LLM 684 开源 574 OpenClaw 557 Claude 557 AI 517 AI 安全 490 开发者工具 432 Codex 416 软件工程 399 具身智能 338 Agent 334 个人成长 334 GitHub 321 生产力 315
阿里 RTPurboV2:原生 Transformer 再次崛起,百步训练实现 10 倍稀疏注意
📌 一句话摘要 阿里 RTP 团队提出 RTPurboV2,通过低秩投影、自适应聚类与动态 top-p 策略,在仅需 600 步微调下,对原生 Transformer 的 Full Attention 实现 16-32 倍计算压缩,Prefill 最高加速 9.36 倍且精度几乎无损。 📝 详细
📅 2026-06-08 10:07 (14 小時前) 机器之心 人工智能 2 分鐘 ★ 88
LLM Attention 机制 模型推理优化 稀疏注意力
首字延迟降低 3.6 倍,腾讯混元提出 Stem 稀疏注意力算法,长文推理加速新 SOTA
📌 一句话摘要 腾讯混元提出 Stem 稀疏注意力算法,通过 Token 位置衰减和输出感知度量两大创新,在仅用 25% 算力下逼近稠密注意力精度,配合 HPC 算子实现 128K 上下文首字延迟降低 3.7 倍,被 ICML 2026 收录。 📝 详细摘要 本文详细介绍了腾讯混元团队提出的 S
📅 2026-06-05 19:23 (3 天前) 腾讯混元 人工智能 2 分鐘 ★ 90
LLM AI 推理 稀疏注意力 模型加速
快手 Keye2.0 开源:将 DSA 注意力引入多模态,开启强化推理新范式
📌 一句话摘要 快手开源 Keye-VL-2.0-30B-A3B 多模态大模型,率先将 DeepSeek 的 DSA 稀疏注意力引入多模态场景,以 30B 总参、3B 激活参数实现视频理解 SOTA,多项基准超越 200B+ 开源模型。 📝 详细摘要 本文介绍了快手正式开源的新版多模态大模型 K
📅 2026-05-30 15:29 (9 天前) 魔搭ModelScope社区 人工智能 2 分鐘 ★ 88
快手 Keye-VL-2.0 多模态大模型 DSA
MiniMax M3 模型预告:基于动态块稀疏注意力的长上下文新架构
📌 一句话摘要 MiniMax 预告了 M3 模型,其核心架构基于 GQA 的动态块稀疏注意力,在 1M token 上下文上速度提升显著。 📝 详细摘要 作者根据 MiniMax AI 工程负责人 Skyler Miao 的预告,介绍了即将发布的 M3 模型。M3 的核心架构是基于 GQA 的
📅 2026-05-27 08:24 (12 天前) Berryxia.AI 人工智能 1 分鐘 ★ 85
MiniMax M3 稀疏注意力 长上下文
将 DSA 注意力引入多模态,快手 Keye2.0 开启强化推理新范式
📌 一句话摘要 快手发布 Keye-VL-2.0-30B-A3B 多模态大模型,首次将 DSA 稀疏注意力机制引入多模态领域,实现 256K 超长上下文无损推理,并解锁 Agent 协作能力,在视频理解、代码、工具调用等多项基准上达到 SOTA。 📝 详细摘要 本文详细介绍了快手最新发布的多模态
📅 2026-05-26 18:17 (13 天前) 克雷西 人工智能 2 分鐘 ★ 86
快手 Keye-VL-2.0 多模态大模型 DSA
将 DSA 注意力引入多模态,快手 Keye2.0 开启强化推理新范式
📌 一句话摘要 快手发布 Keye-VL-2.0-30B-A3B 多模态大模型,首次将 DSA 稀疏注意力机制引入多模态领域,实现 256K 超长上下文无损推理,并解锁 Agent 协作能力,在长视频时序理解、代码生成、工具调用等任务上达到同尺寸 SOTA。 📝 详细摘要 本文是快手技术团队发布
📅 2026-05-26 18:37 (13 天前) 快手技术 人工智能 2 分鐘 ★ 88
Keye-VL-2.0 快手 多模态大模型 DSA
长文本推理一定要改架构?阿里最新提出 RTPurbo:仅需百步训练,无损达到 97%+ 稀疏度与 9 倍加速
📌 一句话摘要 阿里与南大联合提出 RTPurbo,通过轻量级训练(百步、1M tokens)将 Full Attention 模型高效转换为动态稀疏模型,在长文本推理中实现近 9 倍 Prefill 加速与 2 倍 Decode 加速,且精度近乎无损。 📝 详细摘要 本文介绍了阿里巴巴与南京大
📅 2026-05-24 00:00 (16 天前) 青稞AI 人工智能 2 分鐘 ★ 86
稀疏注意力 长上下文推理 模型加速 RTPurbo
163: 详解 DeepSeek V4:Infra 巨鲸、百万上下文走进现实、极致效率优化
📌 一句话摘要 邀请一线 AI 从业者深度拆解 DeepSeek V4 技术报告,探讨混合稀疏注意力、Muon 优化器、MHC 残差连接及 FP4 训练等组合创新,如何让百万上下文从理论走向实用。 📝 详细摘要 本期播客邀请 RadixArk 工程师(SGLang 核心开发者)赵晨阳和 UCLA
📅 2026-04-30 14:00 (04-30 14:00) 晚点聊 LateTalk 人工智能 2 分鐘 ★ 88
DeepSeek V4 混合稀疏注意力 Muon 优化器 MHC
DeepSeek 又当“价格屠夫”,但这次“屠”的不仅是价格
📌 一句话摘要 DeepSeek V4 预览版发布,通过 CSA/HCA 等架构创新将百万上下文推理成本降至行业最低,但全行业系统性降低 Agentic AI 成本仍面临复杂挑战。 📝 详细摘要 本文是《Token 经济学》系列第六篇,深入分析了 DeepSeek V4 预览版发布背后的定价策略
📅 2026-04-28 08:28 (04-28 08:28) 腾讯科技 人工智能 2 分鐘 ★ 88
DeepSeek V4 大模型定价 Token经济学 Agentic AI
北大团队改造 DeepSeek 注意力,速度快四倍还不丢精度
📌 一句话摘要 北京大学张牧涵团队提出 HISA 稀疏注意力机制,通过分层索引解决长文本下的计算瓶颈,在不损失精度且无需重训的情况下,将 DeepSeek 等模型的索引速度提升 2-4 倍。 📝 详细摘要 本文介绍了北京大学人工智能研究院提出的新型稀疏注意力机制 HISA(分层索引稀疏注意力)。
📅 2026-04-06 23:25 (04-06 23:25) 听雨 人工智能 1 分鐘 ★ 92
DeepSeek HISA 稀疏注意力 长文本优化
IndexCache,一种新型稀疏注意力优化器,可使长上下文 AI 模型推理速度提升 1.82 倍
📌 一句话摘要 IndexCache 是一种新型稀疏注意力优化技术,通过跨层缓存索引来减少 DeepSeek 风格模型中的冗余计算,在不影响性能的前提下显著提升推理速度。 📝 详细摘要 IndexCache 解决了 DeepSeek 稀疏注意力(DSA)架构中的计算瓶颈问题,即“闪电索引器”(l
📅 2026-03-28 01:59 (03-28 01:59) Ben Dickson 人工智能 1 分鐘 ★ 88
LLM 稀疏注意力 推理优化 DeepSeek
IndexCache:通过索引复用加速稀疏注意力
📌 一句话摘要 IndexCache 提出通过跨层索引复用,以加速 Transformer 模型中的稀疏注意力机制。 📝 详细摘要 这条推文介绍了“IndexCache”,这是一种旨在加速 Transformer 模型中稀疏注意力的技术方法。通过在不同层之间复用索引,该方法减少了冗余计算,有望在
📅 2026-03-14 00:10 (03-14 00:10) AK 人工智能 1 分鐘 ★ 83
稀疏注意力 推理优化 Transformer IndexCache