← 回總覽

硅谷深陷算力荒:H200 一夜涨价 30%,H100 抢到缺货,Karpathy 也未能幸免

📅 2026-05-24 10:15 InfoQ 中文 商业科技 2 分鐘 1623 字 評分: 86
算力荒 GPU 短缺 H100 H200 AI 基础设施
📌 一句话摘要 2026 年 5 月的硅谷正经历前所未有的 AI 算力荒,H100/H200 价格飙升、一卡难求,连英伟达内部团队和谷歌研究员都难以获取足够算力,算力正从基础设施变成一种筛选机制。 📝 详细摘要 本文深度报道了 2026 年 5 月硅谷面临的 AI 算力危机。文章通过多个真实案例展现了算力短缺的严峻程度:英伟达应用深度学习研究团队负责人 Bryan Catanzaro 向黄仁勋申请训练卡,却被告知「卡已经卖掉了」;谷歌 DeepMind 研究员因内部 TPU 资源优先流向付费客户和旗舰模型而离职创业;AI 大神 Andrej Karpathy 在录制教学视频时发现,让学员启

📌 一句话摘要

2026 年 5 月的硅谷正经历前所未有的 AI 算力荒,H100/H200 价格飙升、一卡难求,连英伟达内部团队和谷歌研究员都难以获取足够算力,算力正从基础设施变成一种筛选机制。

📝 详细摘要

本文深度报道了 2026 年 5 月硅谷面临的 AI 算力危机。文章通过多个真实案例展现了算力短缺的严峻程度:英伟达应用深度学习研究团队负责人 Bryan Catanzaro 向黄仁勋申请训练卡,却被告知「卡已经卖掉了」;谷歌 DeepMind 研究员因内部 TPU 资源优先流向付费客户和旗舰模型而离职创业;AI 大神 Andrej Karpathy 在录制教学视频时发现,让学员启动一台 8×H100 服务器本身就是一道难以逾越的门槛。文章揭示了算力市场的反常现象:H100 一年期合约租金半年涨近 40%,H200 现货价格甚至比新一代 B200 还贵。同时,大企业 GPU 集群平均利用率仅 5% 左右,但企业因 FOMO 心态不敢释放闲置算力,形成「短缺制造恐慌,恐慌制造囤积,囤积制造更深的短缺」的恶性循环。文章还分析了国内开发者在过渡期面临的双重压力,指出 AI 民主化正卡在算力门槛上——模型越来越开放,但能跑起来的人并没有变多。

💡 主要观点

- 硅谷正经历前所未有的 AI 算力荒,连英伟达内部团队和谷歌研究员都难以获取足够算力。 英伟达应用深度学习研究团队负责人申请训练卡被黄仁勋告知已售罄;谷歌 DeepMind 研究员因内部 TPU 资源优先流向付费客户而离职创业,算力短缺已从外部蔓延至大厂内部。

算力市场出现反常定价:旧款 H100/H200 价格飙升,甚至比新一代 B200 还贵。 H100 一年期合约租金半年涨近 40%,H200 现货价格达 6.40 美元/小时,超过 B200 的 5.68 美元。原因在于算力按「好用、好接入」定价,而非按「更新」定价,成熟生态的确定性更具价值。
大企业 GPU 利用率极低,但 FOMO 心态导致算力囤积,形成恶性循环。 Cast AI 报告显示大企业 GPU 集群平均利用率仅 5%,但企业因担心错过订单而签长约,即使闲置也不释放,导致「短缺制造恐慌,恐慌制造囤积,囤积制造更深的短缺」。
算力正从基础设施变成一种筛选机制,AI 民主化卡在算力门槛上。 模型和代码可以开源,但 H100 不能 fork。没有预算、配额和长期合同的群体被算力筛选掉,AI 研究的前提变成拿到一组昂贵且不稳定的 GPU,开源的平等被算力的不平等重新抵消。

💬 文章金句

- 当年帮英伟达赌对算力卡的人,现在却买不到自家的 GPU 了。

  • 短缺制造恐慌,恐慌制造囤积,囤积制造更深的短缺。
  • 做工程的人最懂:最先进不等于最好用,真正值钱的是确定性。
  • 代码可以开源,但 H100 不能 fork。
  • 算力正在从基础设施,变成一种筛选机制。

📊 文章信息

AI 初评:86

来源:InfoQ 中文

作者:InfoQ 中文

分类:商业科技

语言:中文

阅读时间:13 分钟

字数:3106

标签: 算力荒, GPU 短缺, H100, H200, AI 基础设施

阅读完整文章

查看原文 → 發佈: 2026-05-24 10:15:00 收錄: 2026-05-24 20:00:43

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。