AI 安全研究预期效用收益的估算 — LessWrong

📌 一句话摘要

本文利用费米估算（Fermi estimation）量化了 AI 安全研究的潜在影响，计算了每位研究人员预期挽救的人类生命年数，并将这些数据与有效利他主义（Effective Altruism）的基准进行了比较。

📝 详细摘要

作者通过粗略计算（back-of-the-envelope calculation），以挽救的人类生命数量为指标，估算了 AI 安全研究的预期效用。通过设定全球人口、预期寿命和潜在 AI 灭绝风险等参数，作者推导出了两种情景：低估值和中位估值。该分析试图量化每位研究人员的影响力，并最终将这些发现与有效利他主义在慈善捐赠方面的标准指标进行了比较。尽管具有推测性，但本文为思考 AI 安全工作的生存风险缓解价值提供了一个结构化的框架。

💡 主要观点

- 费米估算为评估 AI 安全工作的影响提供了一个有用但具有推测性的框架。 通过将复杂的生存风险分解为人口增长和灭绝概率等可量化的参数，作者建立了一个粗略的模型，用于比较 AI 安全工作与其他利他主义事业。

AI 安全研究的潜在影响会根据对灭绝风险和研究有效性的假设而发生巨大变化。 作者对比了“低估值”（研究影响微乎其微）和“中位估值”（研究显著降低了灭绝风险），突显了预期效用计算对输入变量的敏感性。

将 AI 安全研究与传统慈善捐赠进行比较，突显了缓解生存风险的高杠杆特性。 分析表明，如果 AI 安全研究能有效降低灭绝风险，那么“每工作一年挽救的生命”这一指标在理论上可能会远超传统的基于捐赠的影响力，尽管这依赖于高度不确定的假设。

💬 文章金句

- 我经常思考我投入的每一小时时间到底有多大的实质性影响，我认为这对其他人来说可能也有参考价值。

我将做出 3 个估算：一个低估值、一个我个人的最佳猜测，以及一个（我认为是）高估值。
工作 1 年挽救一条生命，这仅比有效利他主义英国分部（Effective Altruism UK）所宣传的每年捐赠 3000 英镑挽救 1.2 条生命的效果稍差一点。

📊 文章信息

AI 评分：81

来源：LessWrong

作者：Sean Herrington

分类：人工智能

语言：英文

阅读时间：3 分钟

字数：614

标签： AI 安全, 有效利他主义, 费米估算, 生存风险, 预期效用

阅读完整文章

AI 安全研究预期效用收益的估算 — LessWrong

🤖 問 AI