字节面试官：“Plan-and-Execute 比 ReAct 强在哪？”，我：“名字比较长，显得更高级？”，面试官：“门在那边，走好。”

📌 一句话摘要

本文以面试对话形式，系统对比了 ReAct、Plan-and-Execute、Reflection 三种 Agent 设计范式的核心区别、适用场景和选型策略，并补充了动态 Replan 和 Reflexion 等进阶机制。

📝 详细摘要

文章以字节面试官与候选人的对话切入，深入浅出地解析了 Agent 开发中三种主流设计范式。首先明确了「设计范式」与「推理模式」的概念区别，然后逐一拆解：ReAct 是「边想边干」的单步迭代范式，灵活度高但长任务易跑偏；Plan-and-Execute 是「先规划再执行」的范式，适合复杂长流程任务，且支持「强模型规划、弱模型执行」的混合策略以降低成本；Reflection 并非独立流程，而是可叠加于前两者的「质量增强 buff」。文章还介绍了动态 Replan 和 Reflexion 两种进阶机制，并提供了详细的 token 消耗对比和选型指南，最后给出了面试回答策略。

💡 主要观点

- ReAct 是边想边干的单步迭代范式，灵活度最高但长任务易跑偏。 ReAct 的核心是「思考→行动→观察→再思考」的循环，每一步决策基于上一步结果实时调整，实现简单、逻辑透明，适合流程不固定、复杂度适中的任务。

Plan-and-Execute 将规划与执行解耦，先定完整计划再分步执行，适合复杂长流程任务。 该范式用一个 LLM 负责规划，另一个负责执行，支持「强模型规划、弱模型执行」的混合策略，可大幅降低成本。整体结构清晰，执行链路可控，但灵活度不如 ReAct。

Reflection 不是独立流程，而是可叠加于 ReAct 或 Plan-and-Execute 之上的质量增强机制。 Reflection 通过「生成→评估→改进」的闭环进行自我检查和修正，能有效提升输出质量，减少幻觉和逻辑错误，但代价是增加 token 消耗和延迟。

动态 Replan 和 Reflexion 是解决 Plan-and-Execute 和 Reflection 痛点的进阶机制。 动态 Replan 在每步执行后评估计划是否需要调整，避免计划僵硬；Reflexion 则将失败原因总结为经验教训存入记忆，实现跨任务学习，在 HumanEval 上将 GPT-4 的 pass@1 准确率从 80% 提升至 91%。

💬 文章金句

- ReAct 是边想边干，走一步看一步，单步迭代实时调整，灵活度最高；Plan-and-Execute 是先想全再干，先定完整计划再分步执行，适合长流程复杂任务，不容易跑偏；Reflection 不是独立的完整流程，而是给前两者加的「检查修正 buff」，用来提升输出质量。

设计范式是公司的管理制度，推理模式是员工的干活方法，两者是一一对应的。
这种「强模型规划、弱模型执行」的混合策略，在实际项目中可以把总成本降低 70% 到 90%，而任务完成质量几乎不受影响。
在 HumanEval 代码生成基准测试上，Reflexion 机制把 GPT-4 的 pass@1 准确率从 80% 提升到了 91%，提升幅度超过了 10 个百分点。
工程开发永远是「够用就好」，先把最基础的 ReAct 玩明白，再根据实际需求往上加，别为了炫技搞过度工程化。

📊 文章信息

AI 初评：82

来源：小林coding

作者：小林coding

分类：人工智能

语言：中文

阅读时间：26 分钟

字数：6373

标签： Agent, ReAct, Plan-and-Execute, Reflection, 动态Replan

阅读完整文章

字节面试官：“Plan-and-Execute 比 ReAct 强在哪？”，我：“名字比较长，显得更高级？”，面试官：“门在那边，走好。”

🤖 問 AI