全部 未讀 (21689) ★ 收藏 (0) 🤖 人工智能 (11201) 📊 商业科技 (4470) 💻 软件编程 (1688) 📁 个人成长 (1607) 📁 生活文化 (864) 📁 媒体资讯 (838) 📁 投资财经 (537) 🎨 产品设计 (409) 📁 AI 产品 (39) 📁 体育运动 (28)
篩選中: 🏷️ 智能导购 共 1 篇 ✕ 清除篩選
21691
全部文章
21689
未讀
53
今日新增
0
收藏
📡 Poller 最後抓取: 58 分鐘前 (06-09 02:00)
BestBlogs 精選 (21656)

🏷️ 熱門標籤

AI Agent 2173 AI 编程 994 Anthropic 981 Claude Code 917 AI 智能体 780 OpenAI 745 LLM 689 开源 574 OpenClaw 557 Claude 557 AI 517 AI 安全 492 开发者工具 433 Codex 416 软件工程 399 具身智能 338 Agent 334 个人成长 334 GitHub 321 生产力 315
面向智能导购的 Agent 评测实践
📌 一句话摘要 本文提出一套面向家居导购 Agent 的自动化评估链路,基于结构化多维度 Benchmark 和 LLM-as-a-judge 实现 91.9% 准确率的自动评分,并量化对比发现 gpt51 最优,较线上模型 qwen3-vl 提升 16.4%。 📝 详细摘要 本文来自大淘宝技术
📅 2026-05-15 16:56 (24 天前) 大淘宝技术 人工智能 2 分鐘 ★ 90
Agent 评测 LLM-as-a-Judge 智能导购 多模态