全部 未讀 (21598) ★ 收藏 (0) 🤖 人工智能 (11165) 📊 商业科技 (4460) 💻 软件编程 (1685) 📁 个人成长 (1604) 📁 生活文化 (856) 📁 媒体资讯 (817) 📁 投资财经 (529) 🎨 产品设计 (408) 📁 AI 产品 (39) 📁 体育运动 (27)
篩選中: 🏷️ DeepSeek-V4 共 42 篇 ✕ 清除篩選
21600
全部文章
21598
未讀
187
今日新增
0
收藏
📡 Poller 最後抓取: 56 分鐘前 (06-08 18:00)
BestBlogs 精選 (21565)

🏷️ 熱門標籤

AI Agent 2155 AI 编程 984 Anthropic 981 Claude Code 916 AI 智能体 780 OpenAI 745 LLM 674 开源 574 OpenClaw 557 Claude 557 AI 517 AI 安全 490 开发者工具 432 Codex 416 软件工程 398 具身智能 334 Agent 334 个人成长 331 GitHub 321 生产力 315
深度!DeepSeek-V4 中的 MegaMoE,细致的 Overlap 通信和计算延迟方案
📌 一句话摘要 本文深入分析了 DeepSeek-V4 中 MegaMoE 的实现细节,重点阐述了其通过细粒度 Overlap 通信和计算来提升 MoE 模型性能的架构设计与代码实现。 📝 详细摘要 本文是 DeepSeek-V4 技术报告的深度分析系列之一,聚焦于 MegaMoE 这一核心基础
📅 2026-05-15 13:10 (24 天前) 青稞AI 人工智能 2 分鐘 ★ 86
DeepSeek-V4 MegaMoE MoE 专家并行
DeepSeek-V4 详细分析(2): MegaMoE
📌 一句话摘要 本文深入分析了 DeepSeek-V4 中 MegaMoE 的细粒度专家并行方案,详细解读了其通过通信计算重叠和流水线调度实现 1.5~1.9 倍性能提升的底层实现原理。 📝 详细摘要 本文是 DeepSeek-V4 详细分析系列的第二篇,专注于其基础设施中的 MegaMoE 模
📅 2026-05-14 18:57 (25 天前) zartbot 人工智能 2 分鐘 ★ 88
DeepSeek-V4 MegaMoE 专家并行 CUDA
DeepSeek-V4 的并行策略和计算通信遮掩
📌 一句话摘要 本文深入解析了 DeepSeek-V4 训练中采用的 GPU 并行策略,重点阐述了其通过 PP、EP、DP ZeRO-1 的组合以及 DualPipe 和 Waved-EP 等创新技术,在低带宽 IB 网络下实现计算与通信高效遮掩的核心原理。 📝 详细摘要 本文以 DeepSee
📅 2026-05-07 20:16 (05-07 20:16) AINLP 人工智能 2 分鐘 ★ 88
DeepSeek-V4 GPU 并行策略 MoE 通信遮掩
DeepSeek-V4 的并行策略和计算通信遮掩
📌 一句话摘要 本文深入解析了 DeepSeek-V4 的分布式并行策略,重点阐述了其如何通过 PP、EP、ZeRO-1 的组合以及 DualPipe 和 Waved-EP 等创新技术,在低带宽的 IB 网络上实现高效的计算通信遮掩,从而训练大规模 MoE 模型。 📝 详细摘要 文章以 Deep
📅 2026-05-06 00:01 (05-06 00:01) 大模型智能 人工智能 1 分鐘 ★ 88
DeepSeek-V4 分布式训练 并行策略 计算通信遮掩
DeepSeek-V4 的并行策略和计算通信遮掩
📌 一句话摘要 本文深入解析了 DeepSeek-V4 在低配硬件(8 卡节点 + IB 网络)上训练大规模 MoE 模型时采用的并行策略和计算通信遮掩技术,重点介绍了 PP+EP+ZeRO-1 的组合选择、DualPipe 和 Waved-EP 两种通信遮掩方案的设计原理与适用场景。 📝 详细
📅 2026-05-05 00:01 (05-05 00:01) 青稞AI 人工智能 2 分鐘 ★ 87
DeepSeek-V4 并行策略 计算通信遮掩 MoE
DeepSeek-V4 技术报告背后的 TileLang:如何高效实现大模型中的小算子
📌 一句话摘要 本文深入解读了 DeepSeek-V4 技术报告中 TileLang 的设计理念与实践经验,分析了 DSL 编译器在模型 Infra 中处理小算子的定位优势,并探讨了其 Fragment/Parallel 抽象、Host CodeGen、Z3 Prover 集成等关键技术点。 📝
📅 2026-05-04 00:00 (05-04 00:00) 大模型智能 人工智能 2 分鐘 ★ 87
TileLang DeepSeek-V4 DSL 编译器
DeepSeek-V4 发布后的行业景观
📌 一句话摘要 DeepSeek-V4 发布后,行业关注点从 C 端爆款转向 B 端降本与国产算力生态,标志着 AI 产业褪去浮躁、进入静水流深的务实阶段。 📝 详细摘要 文章分析了 DeepSeek-V4 发布后与 R1 时代截然不同的行业景观。V4 未能在 C 端引发全民热议,主要因为同期海
📅 2026-05-03 16:38 (05-03 16:38) 脑极体 人工智能 2 分鐘 ★ 83
DeepSeek-V4 国产算力 大模型 AI 产业
DeepSeek-V4 技术报告背后的 TileLang:如何高效实现大模型中的小算子
📌 一句话摘要 本文深入解读 DeepSeek-V4 技术报告中 TileLang 的设计理念与工业实践,分析 DSL 编译器在 LLM 推理场景中处理小算子的独特优势,并分享其 Fragment/Parallel 抽象、Host CodeGen、Z3 Prover 集成等关键技术点。 📝 详细
📅 2026-05-03 00:01 (05-03 00:01) 青稞AI 人工智能 2 分鐘 ★ 85
TileLang DeepSeek-V4 DSL 编译器
详解 DeepSeek V4:Infra 巨鲸 “四连击”,百万上下文走进现实
📌 一句话摘要 本文通过深度访谈两位一线 AI 从业者,详细解析了 DeepSeek-V4 在混合注意力、mHC 残差、Muon 优化器和 FP4 训练等四个层面的系统级创新,并探讨了其百万上下文效率提升背后的工程挑战与行业影响。 📝 详细摘要 本文是《晚点 LatePost》对 UCLA 博士
📅 2026-05-02 19:44 (05-02 19:44) 晚点LatePost 人工智能 2 分鐘 ★ 88
DeepSeek-V4 混合注意力 Muon优化器 FP4训练
DeepSeek 多模态新进展:空间标记推理与高效视觉 Token 压缩
📌 一句话摘要 DeepSeek 发布技术报告,提出在推理轨迹中插入空间标记(点、框)来增强多模态空间推理能力,并通过视觉 Token 压缩实现高效推理。 📝 详细摘要 这条推文介绍了 DeepSeek 在多模态推理方面的最新技术进展。核心创新在于将空间标记(点、框)直接嵌入推理轨迹,使模型能够
📅 2026-04-30 20:41 (04-30 20:41) Geek 人工智能 1 分鐘 ★ 85
DeepSeek 多模态 空间推理 视觉 Token 压缩
和美国 AI「御三家」聊 DeepSeekV4 和美团 LongCat,有意外收获
📌 一句话摘要 本文通过模拟与 GPT-5.5、Gemini 3.1、Claude Opus 4.7 的对话,分析了 DeepSeek-V4 和美团 LongCat-2.0-Preview 两大万亿参数大模型同日发布的意义,并探讨了国产算力集群突破、英伟达垄断松动以及 AI 产业竞争格局的深刻变化
📅 2026-04-28 17:05 (04-28 17:05) 阑夕 商业科技 2 分鐘 ★ 86
DeepSeek-V4 美团 LongCat 国产算力 英伟达
DeepSeek-V4 技术报告解读: 从架构到 Infra 的全栈重构
📌 一句话摘要 DeepSeek-V4 技术报告深度解读,聚焦百万上下文基础设施重构、CSA/HCA 混合注意力架构、Specialist+OPD 后训练范式以及 Agent 训练基础设施的四根支柱。 📝 详细摘要 本文是对 DeepSeek-V4 技术报告的深度解读,核心叙事是将百万 toke
📅 2026-04-28 12:06 (04-28 12:06) 青稞AI 人工智能 2 分鐘 ★ 88
DeepSeek-V4 MoE 长上下文 混合注意力
DeepSeek 输入缓存价格大降,降至原价十分之一
📌 一句话摘要 DeepSeek API 全系列输入缓存命中价格降至原价十分之一,同时 V4-Pro 75% 折扣促销持续至 2026 年 5 月 5 日。 📝 详细摘要 该推文引用 DeepSeek 官方公告,报道了 DeepSeek API 系列输入缓存命中价格大幅下调至原价十分之一的消息。
📅 2026-04-27 17:54 (04-27 17:54) 苍何 人工智能 1 分鐘 ★ 83
DeepSeek API 价格下调 输入缓存
AI 周刊 #081 - DeepSeek-V4、GPT-5.5、Kimi K2.6、GPT Image 2.0 发布
📌 一句话摘要 本期 AI 周刊汇总了 DeepSeek-V4、GPT-5.5、Kimi K2.6、GPT Image 2.0 等重磅模型发布,以及 Google DESIGN.md、OpenSRE 等开源工具和 AI 产品管理深度文章。 📝 详细摘要 本期周刊覆盖了 AI 领域一周内的多项重要
📅 2026-04-27 10:35 (04-27 10:35) 印记中文 人工智能 2 分鐘 ★ 84
AI 周刊 DeepSeek-V4 GPT-5.5 Kimi K2.6
国家超算互联网推出 DeepSeek-V4 限时免费对话服务;Anthropic 搭建了智能体间交易的测试交易市场丨 AIGC 日报
📌 一句话摘要 本文汇总了 AI 领域近期动态,涵盖湖南 AI 中心落地、Anthropic 智能体交易市场实验、国家超算互联网推出 DeepSeek-V4 免费服务及京东 AI 硬件孵化计划。 📝 详细摘要 本文是一篇 AIGC 日报,汇总了 2026 年 4 月 24 日至 26 日期间的
📅 2026-04-27 08:06 (04-27 08:06) 创业邦 人工智能 1 分鐘 ★ 78
AIGC 日报 AI 资讯 Anthropic 智能体交易
长安汽车赵非:已经成立 AI 变革委员会;百度智能云上线 DeepSeek-V4 丨 AIGC 日报
📌 一句话摘要 本文汇总了 2026 年 4 月 26 日的四条 AIGC 相关资讯,涵盖 OpenAI 安全争议、豆包查分事件、百度千帆上线 DeepSeek-V4 以及长安汽车成立 AI 变革委员会。 📝 详细摘要 这是一篇 AIGC 日报,汇总了 2026 年 4 月 26 日的四条主要资
📅 2026-04-26 09:30 (04-26 09:30) 创业邦 媒体资讯 1 分鐘 ★ 78
AIGC 日报 OpenAI 百度智能云 DeepSeek-V4
AI 周报:黄仁勋要求英伟达全员使用 OpenAI Codex;混元 Hy3 preview 开源
📌 一句话摘要 本周 AI 周报汇总了 DeepSeek-V4 预览版、OpenAI GPT-5.5、腾讯混元 Hy3 preview、黄仁勋要求全员使用 Codex、人形机器人半马等热点新闻及投融资事件。 📝 详细摘要 本文是创业邦旗下「快鲤鱼」出品的 AI 周报,精选了 2026 年 4 月
📅 2026-04-26 11:20 (04-26 11:20) 创业邦 人工智能 2 分鐘 ★ 82
AI 周报 DeepSeek-V4 OpenAI GPT-5.5 Codex
DeepSeek-V4 Pro API 限时 2.5 折;豆包“提前查到 2026 山东事业编成绩”,最新回应;微博考核全体研发 AI 能力;某大模型泄露用户简历|AI 周报
📌 一句话摘要 本周 AI 产业动态密集:DeepSeek-V4-Pro 限时 2.5 折、GPT-5.5 发布、微博考核研发 AI 能力、字节将 AI 代码贡献率写入 OKR,以及多起数据泄露与安全事件引发行业反思。 📝 详细摘要 本文是 AI 前线出品的 AI 周报,汇总了 2026 年 4
📅 2026-04-26 13:01 (04-26 13:01) AI前线 人工智能 2 分鐘 ★ 85
AI 周报 DeepSeek-V4 GPT-5.5 混元 Hy3
实测 DeepSeekV4:天下武功,唯快不破
📌 一句话摘要 本文评测了 DeepSeek-V4 预览版,指出其核心亮点并非参数规模或长上下文,而是通过效率工程大幅降低长文本场景下的推理计算量和缓存占用,同时分析了其缺乏原生多模态的短板以及背后的商业化挑战。 📝 详细摘要 文章围绕 DeepSeek-V4 预览版的发布展开,首先将其与同日发
📅 2026-04-25 10:06 (04-25 10:06) 人人都是产品经理 人工智能 2 分鐘 ★ 86
DeepSeek-V4 大语言模型 效率工程 长上下文
DeepSeek V4 技术报告英中对照版.pdf
📌 一句话摘要 本文对 DeepSeek-V4 技术报告进行了要点提炼和英中对照版 PDF 资源分享,核心介绍了其围绕百万 token 长上下文推理效率的架构创新。 📝 详细摘要 文章是对 DeepSeek-V4 技术报告的中文解读和资源分享。核心内容围绕 DeepSeek-V4 如何通过架构和
📅 2026-04-25 08:52 (04-25 08:52) AINLP 人工智能 2 分鐘 ★ 82
DeepSeek-V4 大语言模型 长上下文 架构创新