← 回總覽

卡帕西没做完的,开源社区 48 小时搞定了!完全体知识库,token 省 70 倍

📅 2026-04-07 13:50 闻乐 人工智能 1 分鐘 1233 字 評分: 87
Graphify 知识图谱 Karpathy Token 优化 个人知识库
📌 一句话摘要 本文介绍了开源工具 Graphify,它在 Karpathy 个人知识库思路基础上实现了全模态自动图谱化,通过本地 AST 解析和缓存机制将 Token 消耗降低 71.5 倍,且无需向量数据库。 📝 详细摘要 文章详细报道了受 Andrej Karpathy 启发而诞生的开源项目 Graphify。该工具针对 Karpathy 原始工作流中手动整理繁琐、Token 消耗高、缺乏工具封装等痛点进行了全方位升级。Graphify 支持全模态自动解析(涵盖代码、文档、图片),利用 tree-sitter 进行本地 AST 解析以节省 Token,并采用 Leiden 社区发现算

📌 一句话摘要

本文介绍了开源工具 Graphify,它在 Karpathy 个人知识库思路基础上实现了全模态自动图谱化,通过本地 AST 解析和缓存机制将 Token 消耗降低 71.5 倍,且无需向量数据库。

📝 详细摘要

文章详细报道了受 Andrej Karpathy 启发而诞生的开源项目 Graphify。该工具针对 Karpathy 原始工作流中手动整理繁琐、Token 消耗高、缺乏工具封装等痛点进行了全方位升级。Graphify 支持全模态自动解析(涵盖代码、文档、图片),利用 tree-sitter 进行本地 AST 解析以节省 Token,并采用 Leiden 社区发现算法构建无需向量数据库的知识图谱。实测显示其 Token 消耗仅为原始方法的 1/71.5。此外,它支持文件监听和 Git 钩子,实现了知识库的自动化增量更新,为个人知识管理提供了一个开箱即用的「完全体」方案。

💡 主要观点

- 全模态自动化处理,消除手动整理负担。 通过内置多模态管线,自动解析代码结构、文档语义及图片概念,无需人工预处理即可统一入谱,实现万物皆可图谱化。

双阶段流程大幅优化 Token 消耗。 结合本地 AST 解析与并行子代理语义提取,配合 SHA256 缓存机制,在混合语料场景下实现 71.5 倍的 Token 节省。
无需向量数据库,降低部署门槛。 基于图拓扑和 Leiden 算法进行聚类,无需嵌入计算(Embeddings)和复杂配置,支持一键生成交互式 HTML 图谱。
动态监听与增量更新,保持知识时效。 支持文件监听模式和 Git 钩子,在内容变动时自动触发解析,确保知识库随资料新增持续生长,无需重建整个图谱。

💬 文章金句

- Graphify,一款零配置、全模态、本地跑、还特能省 token 的知识图谱工具。

  • 实现了 71.5 倍 token 消耗节省,直接把卡神的/raw 笔记法进化到了完全体。
  • 它的聚类基于图拓扑完成,依靠 Leiden 社区发现算法按边密度划分社区,无需依赖 embeddings。
  • AI 圈现在以小时为单位的迭代玩法,只能说疯狂,太疯狂。

📊 文章信息

AI 评分:87

来源:量子位

作者:闻乐

分类:人工智能

语言:中文

阅读时间:9 分钟

字数:2161

标签: Graphify, 知识图谱, Karpathy, Token 优化, 个人知识库

阅读完整文章

查看原文 → 發佈: 2026-04-07 13:50:13 收錄: 2026-04-07 16:00:47

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。