← 回總覽

AI 成为主流负载后,数据基础设施将如何演进?

📅 2026-04-16 10:15 InfoQ 中文 软件编程 2 分鐘 1648 字 評分: 88
数据基础设施 Apache Doris AI 负载 向量检索 AI 可观测性
📌 一句话摘要 本文基于 Apache Doris 社区的视角,系统阐述了在 AI 成为主流负载的背景下,数据基础设施(特别是分析型数据库)在数据形态、使用范式、技术架构和核心能力上需要进行的演进,并详细介绍了 Doris 2026 年的具体技术规划。 📝 详细摘要 文章指出,随着 AI 应用的爆发,数据基础设施的核心问题正从“如何更快地分析数据”转变为如何支撑智能系统。数据形态从结构化扩展到 JSON、向量和多模态;使用方式从面向人的查询扩展到面向 Agent 的调用和实时消费。Apache Doris 社区将 2026 年的年度主题定为“Scale Intelligence, Acce

📌 一句话摘要

本文基于 Apache Doris 社区的视角,系统阐述了在 AI 成为主流负载的背景下,数据基础设施(特别是分析型数据库)在数据形态、使用范式、技术架构和核心能力上需要进行的演进,并详细介绍了 Doris 2026 年的具体技术规划。

📝 详细摘要

文章指出,随着 AI 应用的爆发,数据基础设施的核心问题正从“如何更快地分析数据”转变为如何支撑智能系统。数据形态从结构化扩展到 JSON、向量和多模态;使用方式从面向人的查询扩展到面向 Agent 的调用和实时消费。Apache Doris 社区将 2026 年的年度主题定为“Scale Intelligence, Accelerate Insight”,并围绕四大关键场景(半结构化数据分析与 AI 可观测性、混合检索与分析、多模态场景与 AI SQL、面向 Agent 的分析能力)和三大底层能力(查询引擎、存储引擎、开放数据湖)展开详细的技术演进规划。文章旨在描绘 AI 时代数据库的演进蓝图,具有前瞻性和实践指导意义。

💡 主要观点

- AI 正在重塑数据基础设施的根本命题,从“分析更快”转向“支撑智能”。 数据系统不再是孤立的数据分析工具,而是智能系统的一部分,需要处理 JSON、向量等新型数据,并支持 Agent 调用、模型理解和实时消费等新范式。

数据库需演进为统一数据平台,同时承载分析、检索与 AI Agent 交互。 未来的数据库需要打破分析、检索(全文/向量)和 Agent 服务之间的壁垒,通过混合检索(HSAP)、AI SQL、语义层和 Data Agent 集成等能力,提供一体化的数据服务。
应对 AI 负载,需在查询引擎、存储引擎和开放数据湖三大底层能力上持续演进。 查询引擎需提升对复杂 SQL、大规模任务和 JSON 查询的性能与稳定性;存储引擎需解决超宽表、大规模向量数据的管理与弹性问题;开放数据湖需强化读写性能、统一治理和生态集成。
AI 可观测性成为关键场景,数据库是构建统一可观测性数据底座的核心。 围绕 Agent 行为日志、LLM tracing 等 JSON 数据的分析,是理解 AI 系统内部运行、识别行为模式和安全风险的重要手段,数据库需要为此提供高效支撑。

💬 文章金句

- 数据形态正在从结构化走向 JSON、向量与多模态,数据使用方式也从面向人扩展到面向 Agent 。数据库面对的,不再是单一分析负载,而是分析、检索与 AI Agent 并存的复合负载。

  • Apache Doris 在 2026 年的规划,核心不再只是提升分析性能,而是响应 AI 时代数据基础设施的根本变化。
  • 在 AI 场景中,检索范式正在从单一模式走向融合。...仅依赖向量检索时,精确匹配能力不足;仅依赖文本检索时,又难以覆盖语义相关但不包含关键词的内容。
  • 问题的关键在于如何在深层嵌套结构、列数持续扩展的情况下,仍然保持可接受的存储成本与查询性能。
  • Scale Intelligence, Accelerate Insight,不仅是年度主题,也定义了 Doris 在 AI 时代的演进方向。

📊 文章信息

AI 初评:88

来源:InfoQ 中文

作者:InfoQ 中文

分类:软件编程

语言:中文

阅读时间:18 分钟

字数:4270

标签: 数据基础设施, Apache Doris, AI 负载, 向量检索, AI 可观测性

阅读完整文章

查看原文 → 發佈: 2026-04-16 10:15:00 收錄: 2026-04-16 18:00:03

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。