高盛研报认为,DeepSeek V4 通过架构升级实现长上下文窗口的大幅降本,并明确押注华为国产芯片,这将加速中国 AI 应用规模化,并巩固云计算与数据中心作为首选投资赛道的逻辑。
📝 详细摘要
本文编译自高盛 Ronald Keung 团队发布的研报,围绕 DeepSeek V4 的发布,从技术、市场、投资三个维度进行了分析。技术层面,V4 通过混合注意力机制(CSA/HCA)、mHC 机制和 Muon 优化器等架构创新,在 100 万 token 超长上下文场景下,将推理所需 FLOPs 降至 V3.2 的 27%,KV 缓存占用降至 10%,显著降低了长时任务的计算成本。市场层面,V4 的开源发布加剧了国内 AI 模型竞争,编程能力、任务完成率与多模态能力成为定价权的核心分水岭,独立 AI 玩家与互联网大厂的优劣势也得以凸显。投资层面,高盛维持对云计算与数据中心板块的推荐评级,认为算力成本效率的持续改善将推动 AI 应用加速渗透,并重点推荐万国数据、世纪互联、阿里巴巴和金山云等标的。
💡 主要观点
- DeepSeek V4 通过架构创新实现长上下文场景的大幅降本。 V4 引入混合注意力机制(CSA/HCA)、mHC 机制和 Muon 优化器,在 100 万 token 上下文下,推理 FLOPs 仅为 V3.2 的 27%,KV 缓存占用降至 10%,为复杂智能体应用落地提供了成本基础。
💬 文章金句
- DeepSeek V4 的核心意义在于以更低成本支持更复杂的智能体应用落地,从而打开 AI 应用规模化的新空间。
- V4 Pro 在 100 万上下文场景下,单词元 token 推理所需浮点运算量(FLOPs)仅为 DeepSeek V3.2 的 27%,KV 缓存占用仅为 10%。
- DeepSeek 预计随着华为 Ascend 950 超级节点在 2026 年下半年实现大规模供货,V4 Pro 版本的 API 定价将迎来显著下降。
- 未来决定各模型定价权的关键差异化因素将集中在两个维度:编程/任务完成成功率与多模态能力。
📊 文章信息
AI 初评:84
来源:华尔街见闻
作者:华尔街见闻
分类:商业科技
语言:中文
阅读时间:9 分钟
字数:2185
标签: DeepSeek V4, 高盛, AI 模型, 国产芯片, 云计算