← 回總覽

Anthropic 被曝雇 1000 名人类工程师“培训”Claude Code,时薪 280 美元:AI 编程越进化越离不开真人兜底

📅 2026-06-05 14:30 InfoQ 中文 人工智能 2 分鐘 1670 字 評分: 86
AI 编程 Claude Code AI 代码治理 AI 安全与对齐 开源社区
📌 一句话摘要 Anthropic 被曝雇佣约 1000 名人类软件工程师,以时薪 280 美元通过 Snorkel AI 的 Marlin 项目训练 Claude Code,揭示 AI 编程工具在复杂工程场景下仍需大量专业人力兜底,并梳理了开源社区与科技公司在 AI 代码治理上的不同路径。 📝 详细摘要 本文围绕 Anthropic 通过 Marlin 项目雇佣约 1000 名人类软件工程师提升 Claude Code 表现这一核心事件展开。文章首先详细介绍了 Marlin 项目的运作方式:承包商在真实 GitHub 仓库中创建类似 PR 的任务,编写提示词并对两个模型输出进行 A/B

📌 一句话摘要

Anthropic 被曝雇佣约 1000 名人类软件工程师,以时薪 280 美元通过 Snorkel AI 的 Marlin 项目训练 Claude Code,揭示 AI 编程工具在复杂工程场景下仍需大量专业人力兜底,并梳理了开源社区与科技公司在 AI 代码治理上的不同路径。

📝 详细摘要

本文围绕 Anthropic 通过 Marlin 项目雇佣约 1000 名人类软件工程师提升 Claude Code 表现这一核心事件展开。文章首先详细介绍了 Marlin 项目的运作方式:承包商在真实 GitHub 仓库中创建类似 PR 的任务,编写提示词并对两个模型输出进行 A/B 测试,从正确性、安全性、可靠性和可维护性等维度评估代码,时薪高达 280 美元。随后,文章引用用户反馈指出 Claude Code 在复杂工程任务中存在质量退化,表现为思考深度下降、修改前阅读行为减少(从平均 6.6 次降至 2.0 次)、倾向选择最低成本方案等。文章进一步梳理了 AI 代码治理的多元路径:Zig 语言明确禁止 AI 生成贡献,Linux 内核则发布指导文件要求透明披露并通过 Assisted-by 标签归因,Cloudflare 则部署了分层 AI 代码审查系统,由七个专门化 AI reviewer 进行初筛,但仍保留人类 reviewer 的最终决策权。文章最后指出,AI 编程工具在追求工程化能力的过程中,人类工程师的兜底作用反而更加凸显。

💡 主要观点

- Anthropic 通过 Marlin 项目雇佣约 1000 名人类工程师,以专业工程实践训练 Claude Code。 项目由数据标注公司 Snorkel AI 执行,承包商在真实 GitHub 仓库中创建 PR 任务,编写提示词并对模型输出进行 A/B 测试,从正确性、安全性、可靠性等维度评估,时薪 280 美元,旨在让模型输出更接近专业开发者的真实工作方式。

Claude Code 在复杂工程场景中存在质量退化,表现为思考深度下降和修改前阅读行为减少。 用户反馈显示,模型在复杂任务中忽视指令、执行错误操作,修改前文件读取次数从平均 6.6 次降至 2.0 次,倾向于选择最低成本方案而非正确方案,反映出长期上下文理解和工程约定遵循能力的不足。
开源社区和科技公司在 AI 代码治理上呈现多元路径:从全面禁止到透明披露。 Zig 语言明确禁止 AI 生成贡献,认为其多为负价值;Linux 内核则发布指导文件,要求 AI 辅助贡献必须透明披露、人类承担法律责任;Cloudflare 部署分层 AI 代码审查系统,由 AI 进行初筛,但保留人类 reviewer 的最终决策权。

💬 文章金句

- 从「vibe coding」走向「工程化 coding」过程中,我们越想让 AI 像高级软件工程师一样工作,似乎就越需要大量真正的软件工程师参与训练。

  • AI 可以写代码、改代码、辅助分析,但不能成为法律责任主体。

📊 文章信息

AI 初评:86

来源:InfoQ 中文

作者:InfoQ 中文

分类:人工智能

语言:中文

阅读时间:25 分钟

字数:6020

标签: AI 编程, Claude Code, AI 代码治理, AI 安全与对齐, 开源社区

阅读完整文章

查看原文 → 發佈: 2026-06-05 14:30:00 收錄: 2026-06-06 02:00:10

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。