DeepSeek V4 正式发布,采用 MoE 架构、百万上下文并适配华为昇腾芯片,但核心人才持续流失迫使创始人梁文锋首次启动外部融资,理想主义面临现实考验。
📝 详细摘要
本文深度报道了 DeepSeek V4 的发布及其背后的战略困境。V4 系列包含 Pro 和 Flash 两个版本,均采用 MoE 架构,原生支持 100 万 token 上下文,并在注意力机制、残差连接和优化器上进行了重大革新。技术层面,V4 首次将华为昇腾 NPU 与英伟达 GPU 并列验证,标志着国产芯片适配的关键一步。然而,文章的核心焦点在于 DeepSeek 面临的人才流失危机:截至 2026 年 4 月,已有 5 位核心技术大牛(郭达雅、罗福莉、王炳宣、阮翀、魏浩然)相继离职,分别流向字节、小米、腾讯、元戎启行等公司。这迫使一直拒绝外部融资的梁文锋首次启动融资计划,目标估值不低于 100 亿美元。文章认为,融资能解决算力和股权定价问题,但无法解决当大厂用数倍资源押注研究员个人坚信的方向时,理想主义组织文化能否留住人才的根本矛盾。
💡 主要观点
- DeepSeek V4 发布,技术层面有重大革新,并首次适配华为昇腾芯片。 V4 系列采用 MoE 架构,Pro 版总参数 1.6 万亿,支持百万上下文,并在注意力机制、残差连接和优化器上进行了架构级创新。更重要的是,V4 首次将华为昇腾 NPU 与英伟达 GPU 并列验证,标志着国产芯片适配取得关键进展。
💬 文章金句
- V4 是梁文锋交给市场的答卷,万亿参数、百万上下文、昇腾芯片、Agent 能力,每一项都是硬指标。融资是梁文锋交给团队的答卷,给股权一个价格,给期权一个锚点,给留下的人一个未来。
- 当外面的世界在用数倍于你的资源、数倍于你的决心,去押注那些你的年轻人坚信的方向时,理想主义能撑多久。
- 不是制度不够好。而是当资本开始为技术方向投票,当大厂开始用天价转会费定义什么是「值得追的方向」,一个不到 200 人的团队,能不能只靠信念和算法,就守住四条核心技术主线的完整性。
📊 文章信息
AI 初评:86
来源:创业邦
作者:创业邦
分类:人工智能
语言:中文
阅读时间:20 分钟
字数:4822
标签: DeepSeek V4, 梁文锋, 华为昇腾, 人才流失, AI 融资