无需 Embedding 构建知识智能体 - Vercel

📌 一句话摘要

Vercel 推出了一种基于文件系统的知识智能体架构，通过 Bash 工具取代传统的向量 Embedding，从而实现更高的透明度、更低的成本和更简单的调试。

📝 详细摘要

本文挑战了目前行业内使用向量数据库和 Embedding 构建知识智能体的标准做法。Vercel 认为，传统的 RAG 技术栈往往是一个难以调试且容易出现静默失败的“黑盒”。相反，他们提出了一种基于文件系统的方法，让智能体在隔离的沙箱环境中使用 grep、find 和 cat 等标准 Bash 命令。实践证明，这种方法更具成本效益（在某案例研究中成本降低了 75%），且具备极高的可解释性，因为开发者可以追踪到获取信息时所使用的确切命令。Vercel 发布了一个开源的知识智能体模板（Knowledge Agent Template），集成了 Vercel Sandbox、AI SDK 和 Chat SDK，旨在帮助开发者构建并将这些智能体部署到 Slack 和 Discord 等多个平台。

💡 主要观点

- 传统的基于 Embedding 的 RAG 技术栈缺乏透明度，且难以调试。 向量数据库往往会静默失败，导致几乎无法确定为什么检索到的是某个特定的数据块而不是另一个。这种“黑盒”特性要求开发者不断调整分块边界和相似度阈值，却缺乏清晰的反馈回路。

使用 Bash 工具进行基于文件系统的搜索，可以提供确定且可解释的检索结果。 通过让智能体访问 grep 和 find 等工具，检索过程变成了一系列可检查的命令。开发者可以清楚地看到搜索了哪些文件、读取了哪些行，从而将流水线调试简化为简单的问答验证。

LLM 在处理文件系统方面具有天然的熟练度，这得益于它们在代码库上的海量训练。 由于模型是在海量代码上训练的，它们本身就是目录导航和文件操作的专家。利用这些现有技能，比强迫模型去适应复杂的专有 Embedding 流水线要高效得多。

通过 Chat SDK，统一的智能体架构可以部署到多个平台。 所提出的架构允许单一的知识库和智能体逻辑同时为 Slack、Discord 和 GitHub 上的用户提供服务。平台特定的适配器负责处理格式化，而核心的基于文件系统的流水线则保持一致且可靠。

💬 文章金句

- 故障模式是静默的：智能体自信地返回了错误的数据块，而你无法追踪从问题到答案的路径。

你是在调试一个问题，而不是在调试流水线。使用文件系统搜索，你无需猜测它为什么选择了那个数据块。
LLM 已经理解文件系统。它们已经在海量代码上进行了训练：导航目录、在文件中 grep、管理复杂代码库中的状态。
构建一个可用的知识智能体，你不需要向量数据库、Embedding 模型或分块流水线。你需要的是文件系统、Bash，以及一种将智能体部署到用户所在平台的方法。

📊 文章信息

AI 评分：88

来源：Vercel News

作者：Ben Sabic, Hugo Richard

分类：人工智能

语言：英文

阅读时间：5 分钟

字数：1120

标签： RAG, AI 智能体, Vercel, 向量数据库, Bash

阅读完整文章

无需 Embedding 构建知识智能体 - Vercel

🤖 問 AI