高盛：DeepSeek V4 对中国 AI 意味着什么？

📌 一句话摘要

高盛研报认为，DeepSeek V4 通过架构升级实现长上下文窗口的大幅降本，并明确押注华为国产芯片，这将加速中国 AI 应用规模化，并巩固云计算与数据中心作为首选投资赛道的逻辑。

📝 详细摘要

本文编译自高盛 Ronald Keung 团队发布的研报，围绕 DeepSeek V4 的发布，从技术、市场、投资三个维度进行了分析。技术层面，V4 通过混合注意力机制（CSA/HCA）、mHC 机制和 Muon 优化器等架构创新，在 100 万 token 超长上下文场景下，将推理所需 FLOPs 降至 V3.2 的 27%，KV 缓存占用降至 10%，显著降低了长时任务的计算成本。市场层面，V4 的开源发布加剧了国内 AI 模型竞争，编程能力、任务完成率与多模态能力成为定价权的核心分水岭，独立 AI 玩家与互联网大厂的优劣势也得以凸显。投资层面，高盛维持对云计算与数据中心板块的推荐评级，认为算力成本效率的持续改善将推动 AI 应用加速渗透，并重点推荐万国数据、世纪互联、阿里巴巴和金山云等标的。

💡 主要观点

- DeepSeek V4 通过架构创新实现长上下文场景的大幅降本。 V4 引入混合注意力机制（CSA/HCA）、mHC 机制和 Muon 优化器，在 100 万 token 上下文下，推理 FLOPs 仅为 V3.2 的 27%，KV 缓存占用降至 10%，为复杂智能体应用落地提供了成本基础。

DeepSeek 明确押注华为昇腾 950 国产芯片，加速算力国产化。 V4 发布的重要信号是 DeepSeek 将华为昇腾 950 超级节点纳入商业路径，预计 2026 年下半年大规模供货后将进一步降低 API 定价，为中国 AI 模型向国产算力迁移提供头部背书。

国内 AI 模型竞争进入差异化阶段，编程与多模态能力成为分水岭。 高盛认为，未来模型定价权的关键差异在于编程/任务完成成功率与多模态能力。独立 AI 玩家（如 MiniMax）组织效率高，互联网大厂（如字节、腾讯）则更适合布局 AI 基础设施。

高盛维持云计算与数据中心为首选投资赛道。 算力成本效率改善将推动 AI 应用加速渗透，企业端 AI 代理与消费端 AI 助手的双轮驱动将支撑云服务定价能力持续提升，重点推荐万国数据、世纪互联、阿里巴巴和金山云。

💬 文章金句

- DeepSeek V4 的核心意义在于以更低成本支持更复杂的智能体应用落地，从而打开 AI 应用规模化的新空间。

V4 Pro 在 100 万上下文场景下，单词元 token 推理所需浮点运算量（FLOPs）仅为 DeepSeek V3.2 的 27%，KV 缓存占用仅为 10%。
DeepSeek 预计随着华为 Ascend 950 超级节点在 2026 年下半年实现大规模供货，V4 Pro 版本的 API 定价将迎来显著下降。
未来决定各模型定价权的关键差异化因素将集中在两个维度：编程/任务完成成功率与多模态能力。

📊 文章信息

AI 初评：84

来源：华尔街见闻

作者：华尔街见闻

分类：商业科技

语言：中文

阅读时间：9 分钟

字数：2185

标签： DeepSeek V4, 高盛, AI 模型, 国产芯片, 云计算

阅读完整文章

高盛：DeepSeek V4 对中国 AI 意味着什么？

🤖 問 AI