← 回總覽

AI 导购在 vivo 官网的落地实践

📅 2026-05-27 20:00 vivo互联网技术 人工智能 2 分鐘 1600 字 評分: 87
AI 导购 Agent 工作流 意图识别 RAG Prompt 工程
📌 一句话摘要 本文详细介绍了 vivo 官网 AI 导购的落地实践,通过意图识别小模型、Agent 工作流、RAG 知识库和结构化输出等方案,实现了为用户推荐手机和解答参数问题的核心功能。 📝 详细摘要 文章系统阐述了 vivo 官网 APP 中 AI 导购功能从技术选型到落地实践的全过程。首先通过对比大模型微调、专用模型构建和 Agent 工作流三种方案,基于成本效益、技术风险和业务适配性选择了 Agent 工作流方案。整体架构采用四层分层设计:应用层、策略层、九问层(智能体平台)和玄机层(大模型计算)。核心方案包括:使用 FastText 小模型进行意图识别(推理时间约 10ms),

📌 一句话摘要

本文详细介绍了 vivo 官网 AI 导购的落地实践,通过意图识别小模型、Agent 工作流、RAG 知识库和结构化输出等方案,实现了为用户推荐手机和解答参数问题的核心功能。

📝 详细摘要

文章系统阐述了 vivo 官网 APP 中 AI 导购功能从技术选型到落地实践的全过程。首先通过对比大模型微调、专用模型构建和 Agent 工作流三种方案,基于成本效益、技术风险和业务适配性选择了 Agent 工作流方案。整体架构采用四层分层设计:应用层、策略层、九问层(智能体平台)和玄机层(大模型计算)。核心方案包括:使用 FastText 小模型进行意图识别(推理时间约 10ms),设计手机参数解读和商品推荐两个智能体,通过 Prompt 工程和 RAG 知识库增强回答准确性,并实现商品卡片、大模型流式输出和相关帖子的结构化展示。上线后首字符响应控制在 2.5s 以内,对业务 GMV 和解决率有正向贡献。

💡 主要观点

- 选择 Agent 工作流方案而非大模型微调或专用模型构建。 基于成本效益、技术风险可控、业务适配性和维护成本四个维度综合评估,Agent 工作流方案在开发成本、泛化能力和迭代效率上表现最优。

使用 FastText 小模型进行意图识别,推理时间约 10ms。 通过合成数据训练 FastText 文本分类模型,替代大语言模型进行前置意图识别,在保证准确率的同时大幅降低响应延迟,部署在 CPU 上即可高效运行。
采用 Prompt 工程 + RAG 知识库 + 信息接口工程的组合策略。 通过精心设计的 Prompt 约束模型行为边界,利用 RAG 从商品推荐和评测知识库中检索相关片段,结合商品接口、智能客服等工程化能力,构建高质量的信息集送入大模型。
实现商品卡片、大模型输出、相关帖子的结构化展示。 通过工程化手段将大模型输出与后端接口数据结合,在流式输出中动态插入商品卡片和社区帖子信息,提升用户体验和信息丰富度。

💬 文章金句

- AI 导购广义上来说,是一个综合的智能体,用户可以与其进行多轮对话;狭义上来说,是通过信息处理工程和大语言模型协同工作来理解用户意图,在约束的条件下回复用户问题。

  • 搭建 AI 导购这个方案,一定要考虑好该方案的能力边界是什么,即要清晰知道 AI 导购在 vivo 官网场景的定位。因此,在构建之初就明确了,要的不是'大而全',而是'小而精'。
  • 通过分层的设计,每层更能清晰自己的职责,只要做好层与层直接的接口对接即可,无需关注其他层的实现细节。
  • 将所有要推荐的手机商品信息按照一定的规则补充到手机推荐列表信息中,然后将其与 Prompt 组合在一起共同送给大模型,让大模型理解用户的咨询问题,并从手机推荐列表中,寻找最适合的手机进行推荐,并给出推荐理由。

📊 文章信息

AI 初评:87

来源:vivo互联网技术

作者:vivo互联网技术

分类:人工智能

语言:中文

阅读时间:41 分钟

字数:10134

标签: AI 导购, Agent 工作流, 意图识别, RAG, Prompt 工程

阅读完整文章

查看原文 → 發佈: 2026-05-27 20:00:00 收錄: 2026-05-28 00:00:26

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。