这家 Agent 公司从 Claude 切到 DeepSeek v4：一年省下数百万美元，迁移工作量却是预期的 100 倍

📌 一句话摘要

Lindy 将其 AI 代理流量从 Anthropic 切换到 DeepSeek v4，每年节省数百万美元推理成本，但迁移工作量比预期高出 100 倍，需大量评估与提示词调整。

📝 详细摘要

初创公司 Lindy 将全部 AI 代理流量从 Anthropic 切换到 DeepSeek v4，每年节省数百万美元推理成本。CEO Flo Crivello 透露，迁移过程耗时 6-9 个月评估，实际工作量比预期多出 100 倍，包括大量在线/离线评估、提示词调整及分阶段上线观察留存率。DeepSeek 在邮件分类、起草回复等核心用例上性能提升，但在复杂自动化任务上仍落后于 Sonnet。文章还分析了推理成本成为 AI 部署最大障碍的背景（GitHub、Uber 案例），以及 DeepSeek v4 的地缘政治意义（全自主技术栈、降低对美依赖），强调大规模 Token 消费者必须行动。

💡 主要观点

- Lindy 从 Anthropic 切换到 DeepSeek v4，每年节省数百万美元推理成本。 CEO Flo Crivello 证实，切换后核心用例性能提升，但迁移工作量超出预期 100 倍，需大量评估与提示词调优。

迁移工作包括系统性的在线/离线评估和分阶段上线。 团队花费 6-9 个月评估开源方案，DeepSeek v4 发布后重点测试，通过观察用户留存率验证模型效果，并针对性调整提示词。

DeepSeek 在部分任务上超越 Anthropic，但在复杂自动化上仍有差距。 在邮件分类、起草回复等简单任务上 DeepSeek 表现更好，但复杂工作流自动化仍不及 Sonnet，不过对 Lindy 的核心业务影响不大。

推理成本已成为 AI 代理公司可持续运营的核心挑战。 GitHub 放弃固定订阅、Uber 四个月烧光全年 AI 预算等案例表明，模型推理成本增速远超预期，推动行业向低成本开源模型转移。

DeepSeek v4 的全自主技术栈具有地缘政治意义。 该模型从芯片（华为 CANN）、框架到模型均由中国自主研发，降低对美依赖，进一步加速了 AI 模型市场的两极分化。

💬 文章金句

- 今天我们扣动了扳机，将 100%的 Lindy 流量从 Anthropic 模型切换到了 DeepSeek v4。

比我们想象的工作要多 100 倍。
像我们这样在 Token 上花很多钱的公司，100% 要行动。不这么做将是不负责任的。

📊 文章信息

AI 初评：86

来源：AI前线

作者：AI前线

分类：人工智能

语言：中文

阅读时间：13 分钟

字数：3193

标签： AI Agent, LLM, 模型评测与基准, AI商业化, 推理成本

阅读完整文章

这家 Agent 公司从 Claude 切到 DeepSeek v4：一年省下数百万美元，迁移工作量却是预期的 100 倍

🤖 問 AI