全部 未讀 (21917) ★ 收藏 (0) 🤖 人工智能 (11250) 📊 商业科技 (4514) 💻 软件编程 (1705) 📁 个人成长 (1611) 📁 媒体资讯 (899) 📁 生活文化 (887) 📁 投资财经 (558) 🎨 产品设计 (414) 📁 AI 产品 (39) 📁 体育运动 (32)
篩選中: 🏷️ 深度注意力 共 1 篇 ✕ 清除篩選
21919
全部文章
21917
未讀
31
今日新增
0
收藏
📡 Poller 最後抓取: 25 分鐘前 (06-10 02:00)
BestBlogs 精選 (21884)

🏷️ 熱門標籤

AI Agent 2201 AI 编程 998 Anthropic 983 Claude Code 924 AI 智能体 780 OpenAI 749 LLM 698 开源 578 OpenClaw 557 Claude 557 AI 519 AI 安全 492 开发者工具 435 Codex 419 软件工程 400 具身智能 342 Agent 336 个人成长 336 GitHub 321 生产力 315
大模型架构的下半场
📌 一句话摘要 本文提出大模型架构已进入以「扩展通信」为核心的下半场,批判了传统残差连接的「累加」范式,并介绍了通过 Flash Depth Attention 和 MoDA 实现层间「选择性检索」的创新方案。 📝 详细摘要 文章由华中科技大学王兴刚团队投稿,系统论述了大模型架构发展的新阶段。作
📅 2026-04-19 18:12 (04-19 18:12) 衡宇 人工智能 2 分鐘 ★ 92
大模型架构 Transformer 深度注意力 残差连接