OpenAI 发布 GPT-5.5 Instant,全面接管 ChatGPT 默认模型,面向所有用户免费开放,核心升级包括幻觉率暴降 52%、数学能力大幅提升、回复精简 30%,以及基于记忆的个性化功能。
📝 详细摘要
文章报道了 OpenAI 最新发布的 GPT-5.5 Instant 模型,该模型已取代 GPT-5.3 Instant 成为 ChatGPT 的默认模型,所有用户均可免费使用。核心升级体现在三个方面:一是性能大幅提升,在 AIME 2025 数学基准上从 65.4% 提升至 81.2%,GPQA 博士级科学题从 78.5% 升至 85.6%,幻觉率在医疗、法律、金融等高风险领域暴降 52.5%;二是回复更加精炼,字数减少 30.2%,告别了此前被用户诟病的「废话多、emoji 乱飞」问题;三是引入个性化功能,模型可主动调用过往聊天记录、上传文件和 Gmail 邮箱来提供个性化回复,并同步上线「记忆来源」功能让用户查看和管理 AI 引用的历史信息。文章还梳理了 OpenAI 模型从 GPT-4o 的「谄媚」到 5.0/5.2 的「僵硬」,再到 5.3 的「减少油腻感」,直至 5.5 追求「准确、精炼、懂你」的演进路线。付费用户可在三个月内手动切换回 5.3,之后将正式退役。
💡 主要观点
- GPT-5.5 Instant 在多项基准测试中取得显著提升,幻觉率暴降 52.5%。 数学 AIME 2025 从 65.4% 升至 81.2%,GPQA 博士级科学题从 78.5% 升至 85.6%,MMMU-Pro 多模态推理从 69.2% 升至 76.0%。在医疗、法律、金融等高风险领域,幻觉率比 5.3 Instant 减少 52.5%。
💬 文章金句
- GPT-5.5 Instant 产生的幻觉比 5.3 Instant 减少了 52.5%。
- GPT-5.5 Instant 的回复字数比前代减少了 30.2%,行数减少了 29.2%。
- 先让 AI 记住你,再让你看到它记住了什么,最后让你决定它该忘掉什么。
- 默认即信任。这四个字,既是 OpenAI 最大的资产,也是它最沉重的责任。
- 每一点改进乘以数亿人,就不是增量,是基本面的重写。
📊 文章信息
AI 初评:87
来源:新智元
作者:新智元
分类:人工智能
语言:中文
阅读时间:13 分钟
字数:3051
标签: GPT-5.5 Instant, OpenAI, ChatGPT, 大语言模型, 模型更新