一台手掌大小、300 克的 AI 主机，为什么能跑 122B 模型？

📌 一句话摘要

本文深度解析联想 AI 主机 P7 如何通过后摩智能的存算一体芯片 M50，在 300 克、30W 功耗的小体积内实现 122B 大模型本地推理，并探讨 Agent 时代对端侧 AI 硬件的新需求。

📝 详细摘要

文章以联想 AI 主机 P7 为核心案例，分析了 Agent 时代对端侧 AI 硬件的新要求：长期在线、低功耗、静音、小体积且能运行大模型。P7 重 300 克、功耗 30W，通过集成后摩漫界 M50 存算一体芯片（160TOPS）和此芯 P1 SoC（30TOPS），实现了 190TOPS 异构算力，支持 122B 参数模型本地部署，推理速度达 50 Tokens/s。文章深入解释了存算一体架构如何通过减少数据搬运来提升能效，并指出这是传统 GPU 路线之外的新路径。文章还探讨了 P7 的一机双模设计（智能体模式与大模型模式），以及后摩智能从 M30 到 M50 的商业化进程，最终得出结论：Agent 浪潮正在将算力竞争从云端推向端侧，存算一体架构有望成为端侧 Agent 时代的硬件新标准。

💡 主要观点

- Agent 时代对端侧 AI 硬件提出新要求：长期在线、低功耗、小体积。 与传统的问答式 AI 不同，Agent 需要 7×24 小时持续运行、自主拆解任务，因此设备比拼的不再是瞬时性能，而是长期稳定运行能力，这要求硬件在功耗、体积和算力之间达到新平衡。

存算一体架构是突破传统 AI 芯片能效瓶颈的关键。 传统芯片因计算与存储单元分离导致数据搬运能耗高，存算一体让数据在存储侧就近计算，大幅减少搬运开销。后摩漫界 M50 的能效是传统架构的 5-10 倍，典型功耗仅 10W。

联想 AI 主机 P7 验证了 Agent Computer 这一新终端形态的可行性。 P7 以 300 克、30W 功耗实现了 122B 模型本地推理，并支持 7×24 小时运行，其“一机双模”设计（智能体模式+大模型模式）为 Agent 场景提供了全新的终端逻辑，而非传统 PC 的简单 AI 升级。

💬 文章金句

- Agent 正在迅速抬高端侧 AI 硬件的门槛。

AI 2.0 时代真正需要的不是 AI PC 的简单升级版，而是一种介于 AI PC 与 AI 工作站之间的新终端。
传统 AI 芯片很难同时兼顾这些需求，核心在于数据搬运——计算单元与存储单元物理分离，数据在两者之间频繁流动，带来额外的能耗与延迟。
GPU 定义了大模型训练时代，而 Agent 的全面爆发，正将算力竞争从云端训练中心，推向海量的端侧、边缘推理节点。

📊 文章信息

AI 初评：82

来源：雷峰网

作者：雷峰网

分类：人工智能

语言：中文

阅读时间：15 分钟

字数：3554

标签：端侧AI, 存算一体, Agent Computer, 联想AI主机P7, 后摩智能

阅读完整文章

一台手掌大小、300 克的 AI 主机，为什么能跑 122B 模型？

🤖 問 AI