← 回總覽

B 站连线:硅谷太有钱,所以做不出 DeepSeek

📅 2026-04-29 18:47 赛博禅心 人工智能 2 分鐘 1715 字 評分: 86
DeepSeek V4 硅谷 AI 效率 Anthropic OpenAI
📌 一句话摘要 本文通过硅谷芯片架构师和前 OpenAI 研究员的对话,分析了 DeepSeek V4 在 token 效率上的突破如何对硅谷 AI 公司形成竞争压力,并探讨了 Anthropic 反超 OpenAI 的原因、硅谷资本效率问题以及芯片格局的变化。 📝 详细摘要 本文整理自 B 站连线节目「硅谷 101」的讨论内容,邀请芯片架构师肖志斌和前 OpenAI 研究员 Jenny Xiao,围绕 DeepSeek V4 发布后的行业影响展开深度分析。文章核心观点包括:DeepSeek V4 通过 CSA/HCA 混合注意力、mHC 流形约束超连接和 Muon 优化器实现了显著的 t

📌 一句话摘要

本文通过硅谷芯片架构师和前 OpenAI 研究员的对话,分析了 DeepSeek V4 在 token 效率上的突破如何对硅谷 AI 公司形成竞争压力,并探讨了 Anthropic 反超 OpenAI 的原因、硅谷资本效率问题以及芯片格局的变化。

📝 详细摘要

本文整理自 B 站连线节目「硅谷 101」的讨论内容,邀请芯片架构师肖志斌和前 OpenAI 研究员 Jenny Xiao,围绕 DeepSeek V4 发布后的行业影响展开深度分析。文章核心观点包括:DeepSeek V4 通过 CSA/HCA 混合注意力、mHC 流形约束超连接和 Muon 优化器实现了显著的 token 效率提升,这给硅谷闭源模型公司画出了「死亡线」;硅谷 AI 公司因资本充裕反而缺乏效率优化动力,给了 DeepSeek 可乘之机;Anthropic 凭借 Claude Code、企业信任和专注战略反超 OpenAI 估值至 1 万亿美元;英伟达在推理市场的地位面临松动,非英伟达芯片(包括国产芯片)有了承接推理 workload 的空间。文章还预告了当晚华为昇腾技术专场直播。

💡 主要观点

- DeepSeek V4 的核心突破在于 token 效率,而非模型能力全面超越。 V4 通过 CSA/HCA 混合注意力、mHC 流形约束超连接和 Muon 优化器,将长上下文 attention 成本从平方关系压下来,实现了显著的推理成本降低,迫使所有模型厂商必须回答如何提高 token 效率。

硅谷 AI 公司资本充裕反而成为效率优化的阻碍。 OpenAI 等公司因资金充足缺乏优化动力,在基础设施上过度投入,而 DeepSeek 因计算资源限制被迫进行创新,形成了「创新都是逼出来的」的竞争格局。
Anthropic 凭借专注战略反超 OpenAI,估值达 1 万亿美元。 Anthropic 的三大优势:Claude Code 驱动收入增长、企业客户信任其安全承诺、专注编程和企业市场而非分散精力。OpenAI 因多线作战(硬件、芯片、购物 app)导致核心体验落后。
英伟达在推理市场的地位面临松动,芯片格局将分化。 V4 降低了推理门槛,非英伟达芯片(AMD、Google TPU、国产芯片)有了承接推理 workload 的空间。未来训练、推理、长上下文、agentic workload 将各自分化,不再是一卡打天下。

💬 文章金句

- 没有效率,AGI 只能是个 demo。有了效率,AGI 才能成为真正的产品和基础设施。

  • DeepSeek 像一把抵在硅谷模型公司背后的枪。这些公司如果跑得不够快,DeepSeek 会追上来,把它们的业务彻底摧毁。
  • 硅谷 AI 公司钱太多,导致没有动力去思考效率,反而给了 DeepSeek 优势。
  • 每一次工业革命中,重要的不仅仅是技术有多好,还在于技术有多便宜。能推动变革的技术,是那些便宜到足以让人们使用的技术。
  • AI 公司的估值是二元的,基础模型公司的存在理由就是模型最强。一旦不再最强,被开源模型超越,估值就归零。

📊 文章信息

AI 初评:86

来源:赛博禅心

作者:赛博禅心

分类:人工智能

语言:中文

阅读时间:19 分钟

字数:4750

标签: DeepSeek V4, 硅谷, AI 效率, Anthropic, OpenAI

阅读完整文章

查看原文 → 發佈: 2026-04-29 18:47:00 收錄: 2026-04-29 22:00:45

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。