深度解析：Codex Pet Skill

📌 一句话摘要

本文深度拆解 OpenAI Codex 的 hatch-pet Skill 源码，揭示其如何将不可控的图像生成能力封装为一条包含资产协议、子代理并行、确定性编译、QA 验收和局部修复的可验证生产流水线，并提炼出对 Agent 工程具有普适启发的高级 Skill 范式。

📝 详细摘要

文章以 OpenAI Codex 的 hatch-pet Skill 为案例，深入剖析了其从用户创意到最终可加载宠物资产的完整工程化流程。作者指出，真正的 Skill 不是提示词模板或角色扮演，而是将领域隐性经验、失败边界和产物协议压缩成 Agent 可执行的协议。文章详细拆解了 hatch-pet 的核心设计：通过 SKILL.md 定义生成委托边界（非确定性部分交给 $imagegen，确定性部分由脚本处理），利用 imagegen-jobs.json 作为外部化任务清单管理依赖与状态，采用子代理并行生成动画行但严格隔离父代理的写权限，并通过 record_imagegen_result.py 实现资产溯源。文章还重点分析了其 QA 策略（结构正确性与视觉一致性分层）、局部修复工作流以及 secondary fallback 机制。最终，作者将 hatch-pet 的架构抽象为一条通用链路：intent -> request -> job manifest -> generated candidates -> recorded provenance -> compiled artifact -> QA result -> targeted repair -> packaged asset，并提炼出对 Agent 工程的核心启发：模型是创意工作者而非可信提交者，关键状态应外部化为 manifest，多代理的关键是提交权隔离，QA 需区分结构与语义正确，修复应局部化而非全局重试。

💡 主要观点

- 真正的 Skill 是封装领域经验的可执行协议，而非提示词模板或角色扮演。 hatch-pet 将图像生成、资产协议、子代理并行、QA 和打包等环节固化为可验证的生产流水线，展示了 Skill 的本质是将不可控的模型能力关进可控的工程边界内。

关键状态应外部化为 manifest，而非依赖模型上下文。 hatch-pet 通过 imagegen-jobs.json 管理所有任务的依赖、输入、输出和状态，使任务可恢复、可 diff、可被脚本重新验证，比依赖模型记忆更可靠。

多代理架构的核心是提交权隔离，而非简单的并行。 子代理负责生成和筛选候选，但父代理独占 manifest、溯源和打包的写入权限，避免了并行写冲突和 provenance 污染，体现了控制面与工作面的分离。

QA 需分层：结构正确性由脚本验证，视觉一致性依赖人工或模型判断。 validate_atlas.py 能检查尺寸、透明度和帧数，但无法判断角色身份是否漂移。hatch-pet 将自动 QA 与视觉检查拆开，承认 schema correct 不等于 semantic correct。

修复应局部化，而非全局重试。 当某行动画行 QA 失败时，hatch-pet 通过 queue_pet_repairs.py 仅重新生成失败行，并保留已通过验收的部分，将模型生成的不稳定性限制在最小范围内。

💬 文章金句

- 真正的 Skill 不是「让模型换个语气说话」，也不是「把一个 prompt 存成文件」，更不是给 Agent 套一层玄学人设。

Skill 的本质不是角色扮演，也不只是轻量 workflow，而是把不可控的模型能力关进可控的工程边界里。
不要把模型输出直接当成果，而要把它当生产材料。
并行任务可以分发，truth commit 必须集中。
只有底层边界足够硬，上层创意才敢流动。

📊 文章信息

AI 初评：90

来源：浮之静

作者：浮之静

分类：人工智能

语言：中文

阅读时间：45 分钟

字数：11054

标签： Codex Skills, Agent Engineering, AI 编程, 工作流编排, 资产管线

阅读完整文章

深度解析：Codex Pet Skill

🤖 問 AI