← 回總覽

高考前一天,五个 AI 出了同一道作文题

📅 2026-06-06 16:56 APPSO 人工智能 2 分鐘 1680 字 評分: 86
AI 评测 LLM AI 能力边界 教育科技 AI 与人文
📌 一句话摘要 本文通过让五个主流 AI 模型模拟命题高考作文题,揭示了 AI 在理解规则与运用规则之间的结构性局限:AI 擅长提取趋势的最大公约数,却无法制造「意料之外,情理之中」的命题意外。 📝 详细摘要 文章以 1985 年高考作文研究组对「求同思维」与「求异思维」的讨论为引,设计了一个实验:让 Claude、ChatGPT、Gemini、豆包和 Kimi 五个 AI 模型研究 2011-2025 年高考作文真题与命题原则,然后各自出一道 2026 年的作文题。实验发现,五个模型在命题原则上达成高度共识,但最终产出的五道题不约而同地收敛到「科技便利 vs 人文深度」这一框架。文章深入

📌 一句话摘要

本文通过让五个主流 AI 模型模拟命题高考作文题,揭示了 AI 在理解规则与运用规则之间的结构性局限:AI 擅长提取趋势的最大公约数,却无法制造「意料之外,情理之中」的命题意外。

📝 详细摘要

文章以 1985 年高考作文研究组对「求同思维」与「求异思维」的讨论为引,设计了一个实验:让 Claude、ChatGPT、Gemini、豆包和 Kimi 五个 AI 模型研究 2011-2025 年高考作文真题与命题原则,然后各自出一道 2026 年的作文题。实验发现,五个模型在命题原则上达成高度共识,但最终产出的五道题不约而同地收敛到「科技便利 vs 人文深度」这一框架。文章深入分析了每个模型的方法论差异:Claude 研究最深但出了最安全的题,Kimi 聪明地嵌入了长征纪念日,ChatGPT 的「尺度」最有文字质感,豆包则踩中了「反套路」的雷区。作者指出,AI 的本质是「求同机器」,能精准押中最可能的命题方向,但高考命题的核心技术是「反预期」—— 这正是 AI 的结构性盲区。文章最终落脚于一个跨越四十年的命题悖论:每一代「八股」都比上一代更精密,而命题组的任务始终是制造意外。

💡 主要观点

- 五个 AI 模型在命题方向上高度趋同,均落入「科技便利 vs 人文深度」框架。 无论模型的方法论差异多大(Claude 做工程研究、Kimi 做日历计算、ChatGPT 做学术索引),最终五道题的核心意象 —— 摩擦力、方向感、沉淀、尺度、风景 —— 都在表达同一组对立,说明统计模型对文本分布中信号最强的方向存在结构性偏好。

AI 擅长「求同」但无法「求异」,这是其作为统计模型的结构性局限。 AI 能从大量样本中精准提取趋势的最大公约数,给出「情理之中」的答案;但高考命题的核心技术是「反预期」—— 制造「意料之外,情理之中」的意外,这恰恰是统计模型无法做到的。
研究能力最强的模型(Claude)出了最安全的题,揭示了「理解规则」与「运用规则」之间的鸿沟。 Claude 在前序调研中建立了四层研究框架,检索路径和判断优先级均领先,但出题时却给出了最像模拟卷的标准答案。这说明 AI 在「理解」层面可以表现优异,但在需要创造性偏离规则的「运用」层面存在根本性不足。
豆包踩中了命题组最忌讳的「万能素材」雷区。 豆包题目中的「敦煌工匠」「故宫修复师」本身就是考生会背的万能例子,而命题组过去十年最核心的技术追求之一就是「反套路」。一道让考生可以直接搬出万能素材的题,恰好是命题组最不想出的那种题。

💬 文章金句

- AI 是人类造出的最强大的求同机器,它能把所有已知信号汇聚成一个概率最高的解。而我们一次又一次的看到,这种做法最终会导向的是无趣、无效、无力。

  • AI 能给你「情理之中,情理之中」,但好的高考作文题要的是「意料之外,情理之中」。
  • 1985 年的敌人是学生背范文,2015 年的敌人是教辅产业链批量生产模板,2026 年的敌人变成了 AI。每一代的「八股」都比上一代更精密、更高效、更难破除。

📊 文章信息

AI 初评:86

来源:APPSO

作者:APPSO

分类:人工智能

语言:中文

阅读时间:15 分钟

字数:3659

标签: AI 评测, LLM, AI 能力边界, 教育科技, AI 与人文

阅读完整文章

查看原文 → 發佈: 2026-06-06 16:56:00 收錄: 2026-06-07 06:00:02

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。