扒完 DeepSeek V4 报告，我翻出了这个隐藏彩蛋

📌 一句话摘要

本文深入分析了 DeepSeek V4 与 Kimi K2.6 在技术架构上的相互借鉴与五次「撞车」发布，揭示了中国开源 AI 双子星在技术路线、国产芯片适配和开源生态上的协同进化。

📝 详细摘要

文章以 DeepSeek V4 发布为引，发现其训练方案中采用了 Kimi 率先验证的 Muon 优化器，而 Kimi K2 的架构底层则使用了 DeepSeek-V3 提出的 MLA 注意力机制。作者梳理了过去一年两家公司的五次关键「撞车」发布，指出每次撞车都对应着 AI 行业的重要拐点：从 Long-CoT 推理、Agent 能力、百万上下文到国产芯片适配。文章进一步分析了撞车背后的必然性——两家公司在技术路线上殊途同归，共同挑战 Transformer 架构和英伟达算力垄断。DeepSeek 从工程适配切入，让旗舰模型跑在华为昇腾芯片上；Kimi 从架构创新入手，通过线性注意力等技术降低对高端 GPU 的依赖。最终，文章描绘了中国 AI 从「追随者」到「引领者」的转变，以及开源社区正向循环的力量。

💡 主要观点

- DeepSeek V4 与 Kimi K2.6 在技术架构上相互借鉴，形成开源社区的正向循环。 DeepSeek V4 采用了 Kimi 率先验证的 Muon 优化器，而 Kimi K2 的架构底层使用了 DeepSeek-V3 提出的 MLA 注意力机制，体现了开源社区中技术共享与协同进化的健康关系。

两家公司的五次「撞车」发布对应着 AI 行业的五个关键拐点。 从 Long-CoT 推理、Agent 能力、百万上下文到国产芯片适配，每次撞车都标志着中国 AI 在特定技术方向上的突破和行业趋势的转变。

中国 AI 正在从「追随者」转变为「引领者」，并逐步摆脱对英伟达的依赖。 DeepSeek 通过工程适配让旗舰模型跑在华为昇腾芯片上，Kimi 通过架构创新降低对高端 GPU 的依赖，共同推动「用中国的芯片，跑中国的模型」这一目标。

💬 文章金句

- DeepSeek 的技术报告写着 Kimi 的名字，Kimi 的架构底座写着 DeepSeek 的名字。你中有我，我中有你。

你的论文成了我的基础设施，我的创新成了你的底座。写在引用列表里的互相成就。
以前的国产 AI 叙事是「用英伟达的卡，追 OpenAI 的模型」。现在这对双子星同时在写另一个剧本：用中国的芯片，跑中国的模型，服务全世界的开发者。
当闭源模型的价格是开源模型的 50 倍，开源阵营每隔几个月就推出一个新的万亿参数选手，竞争天平正在发生微妙的倾斜。
你的 MLA 是我的基础，我的 Muon 是你的加速器。这大概也是中国在能在短时间内引领全球开源 AI 的重要原因之一。

📊 文章信息

AI 初评：86

来源：爱范儿

作者：李超凡

分类：人工智能

语言：中文

阅读时间：13 分钟

字数：3215

标签： DeepSeek V4, Kimi K2.6, Muon 优化器, MLA 注意力, 开源模型

阅读完整文章

扒完 DeepSeek V4 报告，我翻出了这个隐藏彩蛋

🤖 問 AI