← 回總覽

一台手掌大小、300 克的 AI 主机,为什么能跑 122B 模型?

📅 2026-05-25 12:13 雷峰网 人工智能 2 分鐘 1498 字 評分: 82
端侧AI 存算一体 Agent Computer 联想AI主机P7 后摩智能
📌 一句话摘要 本文深度解析联想 AI 主机 P7 如何通过后摩智能的存算一体芯片 M50,在 300 克、30W 功耗的小体积内实现 122B 大模型本地推理,并探讨 Agent 时代对端侧 AI 硬件的新需求。 📝 详细摘要 文章以联想 AI 主机 P7 为核心案例,分析了 Agent 时代对端侧 AI 硬件的新要求:长期在线、低功耗、静音、小体积且能运行大模型。P7 重 300 克、功耗 30W,通过集成后摩漫界 M50 存算一体芯片(160TOPS)和此芯 P1 SoC(30TOPS),实现了 190TOPS 异构算力,支持 122B 参数模型本地部署,推理速度达 50 Token

📌 一句话摘要

本文深度解析联想 AI 主机 P7 如何通过后摩智能的存算一体芯片 M50,在 300 克、30W 功耗的小体积内实现 122B 大模型本地推理,并探讨 Agent 时代对端侧 AI 硬件的新需求。

📝 详细摘要

文章以联想 AI 主机 P7 为核心案例,分析了 Agent 时代对端侧 AI 硬件的新要求:长期在线、低功耗、静音、小体积且能运行大模型。P7 重 300 克、功耗 30W,通过集成后摩漫界 M50 存算一体芯片(160TOPS)和此芯 P1 SoC(30TOPS),实现了 190TOPS 异构算力,支持 122B 参数模型本地部署,推理速度达 50 Tokens/s。文章深入解释了存算一体架构如何通过减少数据搬运来提升能效,并指出这是传统 GPU 路线之外的新路径。文章还探讨了 P7 的一机双模设计(智能体模式与大模型模式),以及后摩智能从 M30 到 M50 的商业化进程,最终得出结论:Agent 浪潮正在将算力竞争从云端推向端侧,存算一体架构有望成为端侧 Agent 时代的硬件新标准。

💡 主要观点

- Agent 时代对端侧 AI 硬件提出新要求:长期在线、低功耗、小体积。 与传统的问答式 AI 不同,Agent 需要 7×24 小时持续运行、自主拆解任务,因此设备比拼的不再是瞬时性能,而是长期稳定运行能力,这要求硬件在功耗、体积和算力之间达到新平衡。

存算一体架构是突破传统 AI 芯片能效瓶颈的关键。 传统芯片因计算与存储单元分离导致数据搬运能耗高,存算一体让数据在存储侧就近计算,大幅减少搬运开销。后摩漫界 M50 的能效是传统架构的 5-10 倍,典型功耗仅 10W。
联想 AI 主机 P7 验证了 Agent Computer 这一新终端形态的可行性。 P7 以 300 克、30W 功耗实现了 122B 模型本地推理,并支持 7×24 小时运行,其“一机双模”设计(智能体模式+大模型模式)为 Agent 场景提供了全新的终端逻辑,而非传统 PC 的简单 AI 升级。

💬 文章金句

- Agent 正在迅速抬高端侧 AI 硬件的门槛。

  • AI 2.0 时代真正需要的不是 AI PC 的简单升级版,而是一种介于 AI PC 与 AI 工作站之间的新终端。
  • 传统 AI 芯片很难同时兼顾这些需求,核心在于数据搬运——计算单元与存储单元物理分离,数据在两者之间频繁流动,带来额外的能耗与延迟。
  • GPU 定义了大模型训练时代,而 Agent 的全面爆发,正将算力竞争从云端训练中心,推向海量的端侧、边缘推理节点。

📊 文章信息

AI 初评:82

来源:雷峰网

作者:雷峰网

分类:人工智能

语言:中文

阅读时间:15 分钟

字数:3554

标签: 端侧AI, 存算一体, Agent Computer, 联想AI主机P7, 后摩智能

阅读完整文章

查看原文 → 發佈: 2026-05-25 12:13:00 收錄: 2026-05-25 18:00:42

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。