用 Karpathy 的自动研究法，让 Claude 技能全自动进化

📌 一句话摘要

本文介绍了一种基于 Andrej Karpathy 提出的 autoresearch 方法，通过 AI 代理自动循环测试、评分并迭代优化提示词，实现 Claude 技能的全自动进化。

📝 详细摘要

文章详细拆解了由 Andrej Karpathy 提出的「自动研究」（autoresearch）方法论，旨在解决 AI 提示词（Prompt）效果不稳定的问题。该方法的核心在于将提示词视为「菜谱」，通过 AI 代理执行自动化循环：对提示词进行微调、运行测试、根据预设的「是/否」检查清单进行评分，并根据得分决定保留或回退改动。作者分享了将落地页文案通过率从 56% 提升至 92% 的实战案例，并提供了具体的实施步骤、检查清单设计原则以及开源工具链接。该方法不仅适用于提示词优化，还可扩展至网站性能优化、邮件营销等可量化的技术场景。

💡 主要观点

- Autoresearch 方法的核心是「自动化循环迭代」。 模仿科研过程，由 AI 代理对提示词进行微小改动并测试结果，通过持续的「尝试-评估-保留/回退」循环，在无需人工干预的情况下逼近最优解。

建立量化的「是/否」检查清单是成功的关键。 避免使用模糊的评分标准，通过具体的二元判断题（如是否包含数字、是否使用套话）为 AI 提供明确的反馈信号，确保评分的一致性和可操作性。

该方法具有极强的通用性和可迁移性。 凡是能被量化评分的流程（如代码质量、页面加载速度、邮件转化率）都可以利用这种自动研究框架进行性能压榨。

💬 文章金句

- 与其你亲自动手一点点改进，不如让 AI 代理替你循环迭代。

你唯一需要提供的，就是评分标准。
三到六个问题是最佳数量。太多了，技能就会开始「应试」——就像那种把答案背得滚瓜烂熟、却完全没理解知识点的学生。
分数上去了就保留改动，下来了就撤回。然后再来一轮。再来一轮。

📊 文章信息

AI 评分：87

来源：前端早读课

作者：前端早读课

分类：人工智能

语言：中文

阅读时间：13 分钟

字数：3204

标签： Andrej Karpathy, Autoresearch, Prompt Engineering, AI Agent, Claude

阅读完整文章

用 Karpathy 的自动研究法，让 Claude 技能全自动进化

🤖 問 AI