← 回總覽

DeepSeek 寻求首次融资,V4 模型将基于华为昇腾芯片发布

📅 2026-04-18 15:48 AINLP 人工智能 2 分鐘 1600 字 評分: 84
DeepSeek 融资 V4 模型 华为昇腾 英伟达
📌 一句话摘要 本文报道了 DeepSeek 寻求首次外部融资以支持其万亿参数 V4 模型的开发,并披露该模型将基于华为昇腾芯片,旨在摆脱对英伟达生态的依赖。 📝 详细摘要 文章综合多家外媒报道,披露了 AI 公司 DeepSeek 正在寻求其史上首次外部融资,目标估值不低于 100 亿美元,筹集至少 3 亿美元。此举标志着创始人梁文锋从坚持独立到拥抱外部资本的重大转变,旨在为即将发布的 V4 模型储备资金和算力。文章重点介绍了 V4 模型的技术细节:采用 MoE 架构,总参数约 1 万亿,激活参数 370 亿;上下文窗口扩展至 100 万 token,并引入 Engram 条件记忆架构;

📌 一句话摘要

本文报道了 DeepSeek 寻求首次外部融资以支持其万亿参数 V4 模型的开发,并披露该模型将基于华为昇腾芯片,旨在摆脱对英伟达生态的依赖。

📝 详细摘要

文章综合多家外媒报道,披露了 AI 公司 DeepSeek 正在寻求其史上首次外部融资,目标估值不低于 100 亿美元,筹集至少 3 亿美元。此举标志着创始人梁文锋从坚持独立到拥抱外部资本的重大转变,旨在为即将发布的 V4 模型储备资金和算力。文章重点介绍了 V4 模型的技术细节:采用 MoE 架构,总参数约 1 万亿,激活参数 370 亿;上下文窗口扩展至 100 万 token,并引入 Engram 条件记忆架构;支持原生多模态;代码能力大幅强化。最关键的信息是,V4 将运行在华为昇腾芯片上,这是 DeepSeek 首次从英伟达 CUDA 生态迁移至国产硬件平台,具有重要的战略意义。文章分析了此举对英伟达的潜在冲击,并探讨了在激烈竞争和成本压力下,DeepSeek 融资与硬件迁移背后的商业与技术逻辑。

💡 主要观点

- DeepSeek 打破「从不融资」原则,寻求首次外部融资以应对模型开发的高昂成本。 在 AI 大模型竞赛日益烧钱的背景下,即便是以效率著称的 DeepSeek 也需要外部资本支持其万亿参数 V4 模型的研发和部署,防止人才流失并获取更多算力。

DeepSeek V4 技术规格激进,旨在实现性能飞跃并首次拥抱原生多模态。 V4 采用万亿参数 MoE 架构、100 万 token 上下文(Engram 记忆架构)、原生多模态支持,并在代码能力上对标甚至超越 Claude 和 GPT 系列,显示了其技术野心。
V4 的核心战略是迁移至华为昇腾芯片,试图构建不依赖英伟达的前沿 AI 模型生态。 DeepSeek 花费大量精力将 V4 从英伟达 CUDA 生态适配到华为 CANN 架构,这一技术决策具有战略意义,旨在证明前沿 AI 可以脱离美国芯片主导的生态独立运行。
硬件迁移和融资共同反映了中美 AI 竞争进入深水区,技术自主与资本压力并存。 DeepSeek 的转变是多重压力下的结果:中美模型性能差距缩小导致追赶成本剧增,巨头凭借财力快速迭代,以及地缘政治因素推动的供应链自主需求。

💬 文章金句

- 打破「从不融资」铁律的 DeepSeek,这次寻求以不低于 100 亿美元的估值,筹集至少 3 亿美元的资金。

  • V4 采用 MoE 架构,总参数约 1 万亿,但每个 token 仅激活约 370 亿参数,推理成本与 V3 持平。
  • V4 将运行在华为最新的昇腾芯片上。DeepSeek 的工程师们花了大量时间解决 V4 对华为芯片的适配问题,重写核心代码,从英伟达的 CUDA 生态迁移到华为的 CANN 架构。
  • 老黄本人对此也不淡定。他在近期采访中直言,DeepSeek 基于华为平台的新模型「对美国来说将是一个糟糕的结果」。
  • V4 真正的赌注,在于它要证明前沿 AI 可以完全脱离英伟达生态独立运转。3 亿美元,押的就是这一把。

📊 文章信息

AI 初评:84

来源:AINLP

作者:AINLP

分类:人工智能

语言:中文

阅读时间:9 分钟

字数:2130

标签: DeepSeek, 融资, V4 模型, 华为昇腾, 英伟达

阅读完整文章

查看原文 → 發佈: 2026-04-18 15:48:00 收錄: 2026-04-19 00:00:40

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。