美光高管深度解析 AI 时代内存需求的结构性爆发,指出推理环节的内存墙问题正驱动 HBM、SSD 等全层级存储供不应求,全球晶圆厂产能已无法跟上需求。
📝 详细摘要
本文是华尔街见闻对美光科技数据中心业务高级副总裁 Jeremy Werner 的专访编译。Werner 指出,本轮内存需求繁荣与以往周期性波动有本质区别,AI 推理对内存的需求正呈指数级增长。核心原因在于推理过程中的 KV 缓存机制:内存不足会导致 GPU 算力利用率急剧下降,而充足的内存可成倍释放算力。他详细梳理了 AI 数据中心从 HBM 到 SSD 的五层内存层级结构,并透露上下文长度正以每年 30 倍的速度增长。美光正通过 HBM4 和 245TB 超大容量 SSD 应对需求,同时在全球同步推进五座晶圆厂建设。Werner 认为市场尚未充分理解 AI 带来的变革深度,Agentic AI 和物理 AI 的大规模落地才刚刚开始。
💡 主要观点
- AI 推理的内存墙问题正成为算力瓶颈的核心。 推理过程中,内存不足会导致模型从头重新计算,算力需求呈指数级增长;充足的内存可从 GPU 中榨取出平方倍的算力。
💬 文章金句
- 内存已经成为数据中心推理环节突破瓶颈的关键战略资产,也是训练全球最先进模型的核心支撑。我不认为这个趋势会放缓。
- 如果你能提供足够快、足够大的内存,理论上可以从 GPU 中榨取出平方倍的算力。
- 我们没有在全球建造足够多的晶圆厂。
- 在硅谷,大家都非常兴奋,很容易陷入自己的信息茧房。但当我和不在这个行业的朋友聊天,他们很多人还没有意识到未来 20 年将会发生什么。
📊 文章信息
AI 初评:83
来源:华尔街见闻
作者:华尔街见闻
分类:商业科技
语言:中文
阅读时间:10 分钟
字数:2328
标签: 美光, 内存, HBM, SSD, AI 推理