本文基于 Elastic 全球副总裁肖涵的演讲,系统阐述了 AI 搜索向智能体记忆演进的必然性,分析了当前 Agent 记忆的痛点、技术流派、核心挑战,并介绍了 Jina AI 与 Elastic 融合后提供的搜索底座解决方案。
📝 详细摘要
文章以第一人称视角,分享了 Jina AI 创始人、现 Elastic 全球副总裁肖涵在 Elastic 中国 AI 搜索技术大会上的演讲内容。核心观点是:随着 AI Agent 向长时程任务发展,持久化记忆成为关键瓶颈,因此 2026 年的 AI 搜索本质上就是在构建智能体记忆系统。文章首先通过个人使用小龙虾(Crawfish)Agent 的失败案例,揭示了当前 Agent 记忆在 Query 构造、多语言处理上的痛点。随后回顾了搜索技术从关键词、向量、混合搜索到 RAG、Deep Research 的演进脉络,指出 Agent 的 Search-Read-Reason 循环对记忆提出了新要求。作者深入探讨了记忆表征、选择性遗忘、跨模型迁移等核心挑战,并将现有记忆产品划分为数据库派、文件派和模型派三大类,分析了各自的优劣。最后,文章介绍了 Jina AI 与 Elastic 融合后形成的搜索底座三件套(Embedding、Reranker、Reader),并展望了智能体记忆的未来趋势,如统一范式缺失、Unlearning 技术债、以及与推荐系统的融合。
💡 主要观点
- Agent 的长时程任务能力使其持久化记忆成为刚需,而不仅仅是可选项。 当 Agent 需要自主运行数小时甚至数天时,其产生的数百次搜索、阅读和推理经历无法全部塞入上下文窗口,必须依赖外部的高效记忆存储与检索系统,这是智能体实用化的命门。
💬 文章金句
- 大家今天还用 grep+md 做记忆召回,说明我们几年来语义搜索就没做好。
- 只要第一步 Query 构造错了,整个检索就是废的。
- 当 Agent 的目标变成长时程任务,持久记忆就不再是可选项,是命门。
- 机器学习的顶会之一 ICLR 的全称就是 International Conference on Learning Representations,表征学习国际会议。顶会以‘表征’命名,你就知道这个概念在整个 AI 领域的位置。
- 现在我们看到的 agent 系统都有一个最致命的问题,就是它不会选择性遗忘。如果系统不做选择性遗忘,最后一定是乱的。
📊 文章信息
AI 初评:88
来源:Jina AI
作者:Jina AI
分类:人工智能
语言:中文
阅读时间:32 分钟
字数:7974
标签: 智能体记忆, Agent Memory, AI 搜索, RAG, 长时程任务