MIT 追踪 10 万名开发者，揭示了 AI 编程的转化真相：代码翻了 17 倍、软件只增三成

📌 一句话摘要

MIT 与宾夕法尼亚大学联合研究追踪 10 万名开发者发现，AI 编程工具使代码行数增长 17.3 倍，但最终软件发布量仅提升 30%，揭示代码产出与软件交付之间存在巨大鸿沟。

📝 详细摘要

本文详细解读了 MIT 和宾夕法尼亚大学于 2026 年 5 月发表在 NBER 的工作论文，该研究通过追踪 10 万名开发者的产出，系统评估了 AI 编程工具对软件生产率的真实影响。文章梳理了 AI 编程工具从自动补全、同步代理到异步代理的三代演进，并展示了各代工具对代码提交、文件修改、合并请求等不同环节的提效数据。核心发现是，尽管代码行数增长了 17.3 倍，但最终发布的软件版本仅增加 30%，形成明显的「漏斗效应」。研究指出，由于人类在代码审查、测试、产品决策等上游环节的参与不可或缺，AI 的提效存在约 26% 的理论上限。此外，应用商店数据显示，软件供给虽大幅增加，但需求端反应冷淡，「僵尸应用」比例上升。文章最后引用「生产力 J 曲线」理论，指出当前处于 AI 通用技术应用的早期阶段，真正的生产力爆发需要组织流程的配套变革。

💡 主要观点

- AI 编程工具使代码行数增长 17.3 倍，但最终软件发布量仅提升 30%。 研究追踪十万名开发者，发现从代码行到最终发布，产出增幅逐级递减，形成漏斗效应。代码行数增长 17.3 倍，文件数增长 3.9 倍，最终软件发布仅增 30%。

AI 提效存在约 26% 的理论上限，源于人类在软件生产上游环节的不可替代性。 研究建立的 CES 生产函数模型显示，AI 产出与人工投入的替代弹性系数约为 0.25，意味着即使 AI 编写能力无限大，只要代码审查、测试、产品决策等环节仍需人类参与，最终增益就会被压缩至约 26%。

软件供给大幅增加，但需求端反应冷淡，「僵尸应用」比例上升。 应用商店新应用上线数量激增，但新应用上线后三个月内的总使用量持平甚至下滑。iOS 平台上，上线三个月内用户评分数少于 10 的新 App 占比从 79% 升至 86%。

AI 编程工具对低活跃度开发者的提效最为显著，呈现普惠性。 在自动补全阶段，低活跃开发者的提交次数提升 85%，而高活跃开发者仅提升 21%。到同步代理时代，这一差距扩大至 217% 对 62%。

底层大模型迭代升级可直接驱动提效，不同工具间效率差异显著。 研究首次证实，Claude Code 用户在 Opus 4.5 发布后出现与使用时间无关的效率跃升。Claude Code 带来的同步提效达 199%，远超 GitHub Sync Agent 的 43% 和 OpenAI Codex 的 94%。

💬 文章金句

- 即使 AI 的自动化编写能力趋于无穷大，只要更上一层的流水线离不开人类参与，人类程序员阅读、测试和审核的工作没有成比例增加，最终增益都会被急剧压缩。

我们正处于新一轮 J 曲线的初期，当写代码变得空前廉价，如何用 AI 将代码变成可用的软件、让软件真正触达用户，才是下一阶段的考验。

📊 文章信息

AI 初评：87

来源：DeepTech深科技

作者：DeepTech深科技

分类：人工智能

语言：中文

阅读时间：17 分钟

字数：4029

标签： AI 编程, LLM, AI Agent, 生产力研究, 软件工程

阅读完整文章

MIT 追踪 10 万名开发者，揭示了 AI 编程的转化真相：代码翻了 17 倍、软件只增三成

🤖 問 AI