Anthropic 被曝雇 1000 名人类工程师“培训”Claude Code，时薪 280 美元：AI 编程越进化越离不开真人兜底

📌 一句话摘要

Anthropic 被曝雇佣约 1000 名人类软件工程师，以时薪 280 美元通过 Snorkel AI 的 Marlin 项目训练 Claude Code，揭示 AI 编程工具在复杂工程场景下仍需大量专业人力兜底，并梳理了开源社区与科技公司在 AI 代码治理上的不同路径。

📝 详细摘要

本文围绕 Anthropic 通过 Marlin 项目雇佣约 1000 名人类软件工程师提升 Claude Code 表现这一核心事件展开。文章首先详细介绍了 Marlin 项目的运作方式：承包商在真实 GitHub 仓库中创建类似 PR 的任务，编写提示词并对两个模型输出进行 A/B 测试，从正确性、安全性、可靠性和可维护性等维度评估代码，时薪高达 280 美元。随后，文章引用用户反馈指出 Claude Code 在复杂工程任务中存在质量退化，表现为思考深度下降、修改前阅读行为减少（从平均 6.6 次降至 2.0 次）、倾向选择最低成本方案等。文章进一步梳理了 AI 代码治理的多元路径：Zig 语言明确禁止 AI 生成贡献，Linux 内核则发布指导文件要求透明披露并通过 Assisted-by 标签归因，Cloudflare 则部署了分层 AI 代码审查系统，由七个专门化 AI reviewer 进行初筛，但仍保留人类 reviewer 的最终决策权。文章最后指出，AI 编程工具在追求工程化能力的过程中，人类工程师的兜底作用反而更加凸显。

💡 主要观点

- Anthropic 通过 Marlin 项目雇佣约 1000 名人类工程师，以专业工程实践训练 Claude Code。 项目由数据标注公司 Snorkel AI 执行，承包商在真实 GitHub 仓库中创建 PR 任务，编写提示词并对模型输出进行 A/B 测试，从正确性、安全性、可靠性等维度评估，时薪 280 美元，旨在让模型输出更接近专业开发者的真实工作方式。

Claude Code 在复杂工程场景中存在质量退化，表现为思考深度下降和修改前阅读行为减少。 用户反馈显示，模型在复杂任务中忽视指令、执行错误操作，修改前文件读取次数从平均 6.6 次降至 2.0 次，倾向于选择最低成本方案而非正确方案，反映出长期上下文理解和工程约定遵循能力的不足。

开源社区和科技公司在 AI 代码治理上呈现多元路径：从全面禁止到透明披露。 Zig 语言明确禁止 AI 生成贡献，认为其多为负价值；Linux 内核则发布指导文件，要求 AI 辅助贡献必须透明披露、人类承担法律责任；Cloudflare 部署分层 AI 代码审查系统，由 AI 进行初筛，但保留人类 reviewer 的最终决策权。

💬 文章金句

- 从「vibe coding」走向「工程化 coding」过程中，我们越想让 AI 像高级软件工程师一样工作，似乎就越需要大量真正的软件工程师参与训练。

AI 可以写代码、改代码、辅助分析，但不能成为法律责任主体。

📊 文章信息

AI 初评：86

来源：InfoQ 中文

作者：InfoQ 中文

分类：人工智能

语言：中文

阅读时间：25 分钟

字数：6020

标签： AI 编程, Claude Code, AI 代码治理, AI 安全与对齐, 开源社区

阅读完整文章

Anthropic 被曝雇 1000 名人类工程师“培训”Claude Code，时薪 280 美元：AI 编程越进化越离不开真人兜底

🤖 問 AI