深度对话 Macaron AI 创始人 Andrew,探讨如何通过 LoRA 强化学习、长期记忆和持续学习,从 Agent 产品中生长出新一代个性化模型。
📝 详细摘要
本期播客深度对话 Mind Lab 与 Macaron AI 创始人 Andrew,围绕「从 Agent 产品中长出模型公司」这一核心命题展开。Andrew 分享了其团队在万亿参数规模下实现 LoRA 强化学习的突破性进展,成为全球首个在该规模下支持 DSA 和 MTP 的 LoRA RL 基础设施。内容深入剖析了 AI 记忆系统的演进路径,指出当前基于文件系统的记忆(如 OpenClaw 的实践)存在「越用越难用」的根本缺陷,并提出了向参数化记忆(Parametric Memory)转型的必要性。Andrew 详细介绍了其团队构建的基于 LoRA 的个性化模型方案,通过为每个用户维护低秩适配器、实现记忆隔离与持续更新,在百万分之一的基础模型参数开销下,使得「每人一模型」成为工程可能。讨论还涉及了 Agent 数据作为预训练新源的价值、后训练的重要性、模型架构(如 Titans、N-gram)与优化器在记忆学习中的角色,以及从「南坡」(算力堆叠)与「北坡」(应用驱动)两种路径登顶 AGI 的务实选择。
💡 主要观点
- 文件系统记忆存在「越用越难用」的根本缺陷 OpenClaw 等平台依赖文件系统存储记忆,记忆数量单调递增但模型工作记忆有限,导致命中率持续下降,最终体验恶化。
💬 文章金句
- 当模型参数量极小的时候,模型的数学性质本身会更多地去 regularize 它的更新形状,而不只是数据中的信息。我们需要去研究它数学上的范数、黎曼流形。
- 如果我们把 memory 当成能力去评价,它很容易变成为了优化某个 memory benchmark 而做,但实际上 memory 应该为了优化终端任务的 benchmark。
- 越好的模型其实越安全。越好的模型越不容易被钓鱼,越能遵守你设下的限制。这是一个被低估的结论。
- 未来会有追求更聪明更贵的模型,也有追求效率与普及的模型。我们没有能力和资源去追求第一个方向,这是客观现实,要敬畏。
- 我觉得未来是我们和用户去构造一个模型公司,有全尺寸模型能力,但我们的 inside 来源于用户,我们的模型也会服务于用户。
📊 文章信息
AI 初评:88
来源:开始连接LinkStart
作者:开始连接LinkStart
分类:人工智能
语言:中文
阅读时间:174 分钟
字数:43268
标签: LoRA 强化学习, 长期记忆, 持续学习, Agent 模型, 个性化模型