2026 年 5 月的硅谷正经历前所未有的 AI 算力荒,H100/H200 价格飙升、一卡难求,连英伟达内部团队和谷歌研究员都难以获取足够算力,算力正从基础设施变成一种筛选机制。
📝 详细摘要
本文深度报道了 2026 年 5 月硅谷面临的 AI 算力危机。文章通过多个真实案例展现了算力短缺的严峻程度:英伟达应用深度学习研究团队负责人 Bryan Catanzaro 向黄仁勋申请训练卡,却被告知「卡已经卖掉了」;谷歌 DeepMind 研究员因内部 TPU 资源优先流向付费客户和旗舰模型而离职创业;AI 大神 Andrej Karpathy 在录制教学视频时发现,让学员启动一台 8×H100 服务器本身就是一道难以逾越的门槛。文章揭示了算力市场的反常现象:H100 一年期合约租金半年涨近 40%,H200 现货价格甚至比新一代 B200 还贵。同时,大企业 GPU 集群平均利用率仅 5% 左右,但企业因 FOMO 心态不敢释放闲置算力,形成「短缺制造恐慌,恐慌制造囤积,囤积制造更深的短缺」的恶性循环。文章还分析了国内开发者在过渡期面临的双重压力,指出 AI 民主化正卡在算力门槛上——模型越来越开放,但能跑起来的人并没有变多。
💡 主要观点
- 硅谷正经历前所未有的 AI 算力荒,连英伟达内部团队和谷歌研究员都难以获取足够算力。 英伟达应用深度学习研究团队负责人申请训练卡被黄仁勋告知已售罄;谷歌 DeepMind 研究员因内部 TPU 资源优先流向付费客户而离职创业,算力短缺已从外部蔓延至大厂内部。
💬 文章金句
- 当年帮英伟达赌对算力卡的人,现在却买不到自家的 GPU 了。
- 短缺制造恐慌,恐慌制造囤积,囤积制造更深的短缺。
- 做工程的人最懂:最先进不等于最好用,真正值钱的是确定性。
- 代码可以开源,但 H100 不能 fork。
- 算力正在从基础设施,变成一种筛选机制。
📊 文章信息
AI 初评:86
来源:InfoQ 中文
作者:InfoQ 中文
分类:商业科技
语言:中文
阅读时间:13 分钟
字数:3106
标签: 算力荒, GPU 短缺, H100, H200, AI 基础设施