别急着 All-in DeepSeek V4，先看看这 10 位从业者的真心话

📌 一句话摘要

本文汇集了近 10 位 AI 从业者对 DeepSeek V4 的实测反馈，指出其在代码、Agent 和成本控制上表现惊艳，但工具调用稳定性和事实准确性仍是落地短板。

📝 详细摘要

文章围绕 DeepSeek V4 的发布，邀请了开发者、创业者和投资人进行深度体验与讨论。核心观点是：V4 在工程优化上取得了巨大成功，通过混合注意力机制、MoE 架构等创新，将长上下文推理成本压至极低水平，代码和 Agent 能力接近顶级闭源模型。然而，其在事实性知识、工具调用稳定性和复杂推理上仍有明显不足，落地需要额外的 Harness 层来弥补。文章认为，V4 的真正影响在于加速了 AI 应用从「卷模型」向「卷系统」的转变，并推动了国产算力生态的发展。

💡 主要观点

- DeepSeek V4 在工程优化上达到新高度，推理成本极低。 通过混合注意力、MoE 等架构创新，V4-Pro 在处理百万 Token 长上下文时，算力需求降至 V3.2 的 27%，KV 缓存压缩至 10%，实现了结构性降本。

V4 的代码和 Agent 能力接近顶级闭源模型，但稳定性和准确性是短板。 多位从业者反馈，V4 在编程和 Agent 任务上表现惊艳，成本仅为头部模型的四分之一。但工具调用稳定性差和幻觉率高，在长链条任务中错误会被放大，落地需要额外的 Harness 层来弥补。

V4 将加速 AI 应用竞争从「模型能力」转向「系统能力」。 当顶级开源模型性能逼近闭源且成本大幅下降后，模型本身不再是稀缺壁垒。未来的竞争焦点在于如何将模型、Agent、产品场景和数据反馈组织成可靠、低成本、可规模化的生产系统。

V4 的成功推动了国产算力生态的发展。 DeepSeek 完成了对华为昇腾芯片的适配，证明了国产全栈技术方案的可行性，这将催生对国产算力的确定性需求，并带动全产业链投资。

💬 文章金句

- DeepSeek V4 不是'最全能的'，但它是'最值得信赖的'——坚定的开源承诺、完整的技术报告、极低的推理成本、全技术栈国产化，让它成为 ToB 场景下性价比最优的基础模型选择。

V4 的工具调用稳定性+幻觉率仍然是硬伤——这两点必须在 Agent Harness 层面补足，否则在长链条任务里，任务链路一拉长，错误就会被不断放大。
未来 AI 应用的壁垒，也不会是简单调用一个模型，而是把模型、Agent、产品场景和数据反馈组织成一个可靠、低成本、可规模化的生产系统。
DeepSeek V4 的意义在于，它进一步丰富了模型供给层。对企业来说，它不是简单替代某一个海外模型，而是让应用可以更灵活地做多模型编排、自部署和成本优化。

📊 文章信息

AI 初评：86

来源：36氪

作者：36氪

分类：人工智能

语言：中文

阅读时间：33 分钟

字数：8170

标签： DeepSeek V4, 大模型评测, AI 应用, 开源模型, Agent

阅读完整文章

别急着 All-in DeepSeek V4，先看看这 10 位从业者的真心话

🤖 問 AI