← 回總覽

这家 Agent 公司从 Claude 切到 DeepSeek v4:一年省下数百万美元,迁移工作量却是预期的 100 倍

📅 2026-06-22 16:38 AI前线 人工智能 2 分鐘 1462 字 評分: 86
AI Agent LLM 模型评测与基准 AI商业化 推理成本
📌 一句话摘要 Lindy 将其 AI 代理流量从 Anthropic 切换到 DeepSeek v4,每年节省数百万美元推理成本,但迁移工作量比预期高出 100 倍,需大量评估与提示词调整。 📝 详细摘要 初创公司 Lindy 将全部 AI 代理流量从 Anthropic 切换到 DeepSeek v4,每年节省数百万美元推理成本。CEO Flo Crivello 透露,迁移过程耗时 6-9 个月评估,实际工作量比预期多出 100 倍,包括大量在线/离线评估、提示词调整及分阶段上线观察留存率。DeepSeek 在邮件分类、起草回复等核心用例上性能提升,但在复杂自动化任务上仍落后于 Son

📌 一句话摘要

Lindy 将其 AI 代理流量从 Anthropic 切换到 DeepSeek v4,每年节省数百万美元推理成本,但迁移工作量比预期高出 100 倍,需大量评估与提示词调整。

📝 详细摘要

初创公司 Lindy 将全部 AI 代理流量从 Anthropic 切换到 DeepSeek v4,每年节省数百万美元推理成本。CEO Flo Crivello 透露,迁移过程耗时 6-9 个月评估,实际工作量比预期多出 100 倍,包括大量在线/离线评估、提示词调整及分阶段上线观察留存率。DeepSeek 在邮件分类、起草回复等核心用例上性能提升,但在复杂自动化任务上仍落后于 Sonnet。文章还分析了推理成本成为 AI 部署最大障碍的背景(GitHub、Uber 案例),以及 DeepSeek v4 的地缘政治意义(全自主技术栈、降低对美依赖),强调大规模 Token 消费者必须行动。

💡 主要观点

- Lindy 从 Anthropic 切换到 DeepSeek v4,每年节省数百万美元推理成本。 CEO Flo Crivello 证实,切换后核心用例性能提升,但迁移工作量超出预期 100 倍,需大量评估与提示词调优。

迁移工作包括系统性的在线/离线评估和分阶段上线。 团队花费 6-9 个月评估开源方案,DeepSeek v4 发布后重点测试,通过观察用户留存率验证模型效果,并针对性调整提示词。
DeepSeek 在部分任务上超越 Anthropic,但在复杂自动化上仍有差距。 在邮件分类、起草回复等简单任务上 DeepSeek 表现更好,但复杂工作流自动化仍不及 Sonnet,不过对 Lindy 的核心业务影响不大。
推理成本已成为 AI 代理公司可持续运营的核心挑战。 GitHub 放弃固定订阅、Uber 四个月烧光全年 AI 预算等案例表明,模型推理成本增速远超预期,推动行业向低成本开源模型转移。
DeepSeek v4 的全自主技术栈具有地缘政治意义。 该模型从芯片(华为 CANN)、框架到模型均由中国自主研发,降低对美依赖,进一步加速了 AI 模型市场的两极分化。

💬 文章金句

- 今天我们扣动了扳机,将 100%的 Lindy 流量从 Anthropic 模型切换到了 DeepSeek v4。

  • 比我们想象的工作要多 100 倍。
  • 像我们这样在 Token 上花很多钱的公司,100% 要行动。不这么做将是不负责任的。

📊 文章信息

AI 初评:86

来源:AI前线

作者:AI前线

分类:人工智能

语言:中文

阅读时间:13 分钟

字数:3193

标签: AI Agent, LLM, 模型评测与基准, AI商业化, 推理成本

阅读完整文章

查看原文 → 發佈: 2026-06-22 16:38:00 收錄: 2026-06-23 02:00:40

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。