Gary Marcus 引用了一项新的基准测试,显示顶级 LLM 在单挑扑克中的表现明显逊于人类专业选手,并以此证明它们距离 AGI 还很遥远。
📝 详细摘要
Gary Marcus 引用了 GTO Wizard AI 的一项研究,该研究测试了全球最顶尖的 LLM 在单挑无限额德州扑克(NLHE)中的表现。结果显示,表现最好的模型每 100 手牌损失 16 个大盲注(16 bb/100),而顶级人类职业选手面对同一 AI 时仅损失约 4 bb/100。Marcus 利用这种在具有隐藏信息的策略性游戏中的表现差距,支持他长期以来的批评观点,即 LLM 缺乏实现通用人工智能(AGI)所需的推理能力。
📊 文章信息
AI 评分:82
来源:Gary Marcus(@GaryMarcus)
作者:Gary Marcus
分类:人工智能
语言:英文
阅读时间:1 分钟
字数:68
标签: LLM 基准测试, AGI, 扑克 AI, 策略推理, Gary Marcus