本文基于 Apache Doris 社区的视角,系统阐述了在 AI 成为主流负载的背景下,数据基础设施(特别是分析型数据库)在数据形态、使用范式、技术架构和核心能力上需要进行的演进,并详细介绍了 Doris 2026 年的具体技术规划。
📝 详细摘要
文章指出,随着 AI 应用的爆发,数据基础设施的核心问题正从“如何更快地分析数据”转变为如何支撑智能系统。数据形态从结构化扩展到 JSON、向量和多模态;使用方式从面向人的查询扩展到面向 Agent 的调用和实时消费。Apache Doris 社区将 2026 年的年度主题定为“Scale Intelligence, Accelerate Insight”,并围绕四大关键场景(半结构化数据分析与 AI 可观测性、混合检索与分析、多模态场景与 AI SQL、面向 Agent 的分析能力)和三大底层能力(查询引擎、存储引擎、开放数据湖)展开详细的技术演进规划。文章旨在描绘 AI 时代数据库的演进蓝图,具有前瞻性和实践指导意义。
💡 主要观点
- AI 正在重塑数据基础设施的根本命题,从“分析更快”转向“支撑智能”。 数据系统不再是孤立的数据分析工具,而是智能系统的一部分,需要处理 JSON、向量等新型数据,并支持 Agent 调用、模型理解和实时消费等新范式。
💬 文章金句
- 数据形态正在从结构化走向 JSON、向量与多模态,数据使用方式也从面向人扩展到面向 Agent 。数据库面对的,不再是单一分析负载,而是分析、检索与 AI Agent 并存的复合负载。
- Apache Doris 在 2026 年的规划,核心不再只是提升分析性能,而是响应 AI 时代数据基础设施的根本变化。
- 在 AI 场景中,检索范式正在从单一模式走向融合。...仅依赖向量检索时,精确匹配能力不足;仅依赖文本检索时,又难以覆盖语义相关但不包含关键词的内容。
- 问题的关键在于如何在深层嵌套结构、列数持续扩展的情况下,仍然保持可接受的存储成本与查询性能。
- Scale Intelligence, Accelerate Insight,不仅是年度主题,也定义了 Doris 在 AI 时代的演进方向。
📊 文章信息
AI 初评:88
来源:InfoQ 中文
作者:InfoQ 中文
分类:软件编程
语言:中文
阅读时间:18 分钟
字数:4270
标签: 数据基础设施, Apache Doris, AI 负载, 向量检索, AI 可观测性