本文汇集了近 10 位 AI 从业者对 DeepSeek V4 的实测反馈,指出其在代码、Agent 和成本控制上表现惊艳,但工具调用稳定性和事实准确性仍是落地短板。
📝 详细摘要
文章围绕 DeepSeek V4 的发布,邀请了开发者、创业者和投资人进行深度体验与讨论。核心观点是:V4 在工程优化上取得了巨大成功,通过混合注意力机制、MoE 架构等创新,将长上下文推理成本压至极低水平,代码和 Agent 能力接近顶级闭源模型。然而,其在事实性知识、工具调用稳定性和复杂推理上仍有明显不足,落地需要额外的 Harness 层来弥补。文章认为,V4 的真正影响在于加速了 AI 应用从「卷模型」向「卷系统」的转变,并推动了国产算力生态的发展。
💡 主要观点
- DeepSeek V4 在工程优化上达到新高度,推理成本极低。 通过混合注意力、MoE 等架构创新,V4-Pro 在处理百万 Token 长上下文时,算力需求降至 V3.2 的 27%,KV 缓存压缩至 10%,实现了结构性降本。
💬 文章金句
- DeepSeek V4 不是'最全能的',但它是'最值得信赖的'——坚定的开源承诺、完整的技术报告、极低的推理成本、全技术栈国产化,让它成为 ToB 场景下性价比最优的基础模型选择。
- V4 的工具调用稳定性+幻觉率仍然是硬伤——这两点必须在 Agent Harness 层面补足,否则在长链条任务里,任务链路一拉长,错误就会被不断放大。
- 未来 AI 应用的壁垒,也不会是简单调用一个模型,而是把模型、Agent、产品场景和数据反馈组织成一个可靠、低成本、可规模化的生产系统。
- DeepSeek V4 的意义在于,它进一步丰富了模型供给层。对企业来说,它不是简单替代某一个海外模型,而是让应用可以更灵活地做多模型编排、自部署和成本优化。
📊 文章信息
AI 初评:86
来源:36氪
作者:36氪
分类:人工智能
语言:中文
阅读时间:33 分钟
字数:8170
标签: DeepSeek V4, 大模型评测, AI 应用, 开源模型, Agent