Gary Marcus 强调的一项研究显示,当前的 AI 基准测试与 92% 的现实工作任务脱节,过度集中在编程和数学领域。
📝 详细摘要
引用斯坦福大学和卡内基梅隆大学研究人员的一项研究,Gary Marcus 指出了 AI 发展中的一个重大缺口:被分析的 43 个基准测试几乎完全集中在编程和数学上(仅代表 7.6% 的工作岗位),而忽略了管理和法律等高价值领域。研究表明,AI Agent 的进展是根据易于自动评分的任务来衡量的,而非实际劳动力市场所需的复杂人际交往或专业技能。Marcus 赞扬了该总结没有夸大其词和过度炒作。
📊 文章信息
AI 评分:86
来源:Gary Marcus(@GaryMarcus)
作者:Gary Marcus
分类:人工智能
语言:英文
阅读时间:1 分钟
字数:141
标签: AI 基准测试, AI Agent, 经济影响, 斯坦福大学研究, CMU 研究