Anthropic 被曝雇佣约 1000 名人类软件工程师,以时薪 280 美元通过 Snorkel AI 的 Marlin 项目训练 Claude Code,揭示 AI 编程工具在复杂工程场景下仍需大量专业人力兜底,并梳理了开源社区与科技公司在 AI 代码治理上的不同路径。
📝 详细摘要
本文围绕 Anthropic 通过 Marlin 项目雇佣约 1000 名人类软件工程师提升 Claude Code 表现这一核心事件展开。文章首先详细介绍了 Marlin 项目的运作方式:承包商在真实 GitHub 仓库中创建类似 PR 的任务,编写提示词并对两个模型输出进行 A/B 测试,从正确性、安全性、可靠性和可维护性等维度评估代码,时薪高达 280 美元。随后,文章引用用户反馈指出 Claude Code 在复杂工程任务中存在质量退化,表现为思考深度下降、修改前阅读行为减少(从平均 6.6 次降至 2.0 次)、倾向选择最低成本方案等。文章进一步梳理了 AI 代码治理的多元路径:Zig 语言明确禁止 AI 生成贡献,Linux 内核则发布指导文件要求透明披露并通过 Assisted-by 标签归因,Cloudflare 则部署了分层 AI 代码审查系统,由七个专门化 AI reviewer 进行初筛,但仍保留人类 reviewer 的最终决策权。文章最后指出,AI 编程工具在追求工程化能力的过程中,人类工程师的兜底作用反而更加凸显。
💡 主要观点
- Anthropic 通过 Marlin 项目雇佣约 1000 名人类工程师,以专业工程实践训练 Claude Code。 项目由数据标注公司 Snorkel AI 执行,承包商在真实 GitHub 仓库中创建 PR 任务,编写提示词并对模型输出进行 A/B 测试,从正确性、安全性、可靠性等维度评估,时薪 280 美元,旨在让模型输出更接近专业开发者的真实工作方式。
💬 文章金句
- 从「vibe coding」走向「工程化 coding」过程中,我们越想让 AI 像高级软件工程师一样工作,似乎就越需要大量真正的软件工程师参与训练。
- AI 可以写代码、改代码、辅助分析,但不能成为法律责任主体。
📊 文章信息
AI 初评:86
来源:InfoQ 中文
作者:InfoQ 中文
分类:人工智能
语言:中文
阅读时间:25 分钟
字数:6020
标签: AI 编程, Claude Code, AI 代码治理, AI 安全与对齐, 开源社区