← 回總覽

LWiAI 播客 #238 - GPT-5.4 mini、OpenAI 战略转型、Mamba 3、注意力残差

📅 2026-04-01 16:07 Last Week in AI 人工智能 2 分鐘 1563 字 評分: 86
GPT-5.4 Mistral Small 4 AI 智能体 Nvidia GTC Mamba-3
📌 一句话摘要 一份全面的 AI 每周发展综述,涵盖 OpenAI 的 GPT-5.4 mini 发布、Mistral 的 Small 4 模型、日益激烈的 AI 智能体“操作系统”竞争,以及 Mamba-3 等重大研究进展。 📝 详细摘要 本期 Last Week in AI 播客总结了 AI 行业关键的一周。主要亮点包括 OpenAI 发布了具备 40 万 token 上下文窗口但价格上涨的 GPT-5.4 mini 和 nano 模型。Mistral 推出了 Small 4 MoE 模型系列以及用于自定义模型训练的 Forge 平台。“智能体操作系统”竞赛因 Meta (Manus)

📌 一句话摘要

一份全面的 AI 每周发展综述,涵盖 OpenAI 的 GPT-5.4 mini 发布、Mistral 的 Small 4 模型、日益激烈的 AI 智能体“操作系统”竞争,以及 Mamba-3 等重大研究进展。

📝 详细摘要

本期 Last Week in AI 播客总结了 AI 行业关键的一周。主要亮点包括 OpenAI 发布了具备 40 万 token 上下文窗口但价格上涨的 GPT-5.4 mini 和 nano 模型。Mistral 推出了 Small 4 MoE 模型系列以及用于自定义模型训练的 Forge 平台。“智能体操作系统”竞赛因 Meta (Manus) 和 Nvidia (Open Shell) 的新入局者而升温。此外,本期节目还涵盖了 Nvidia GTC 2026 的公告、OpenAI 向企业生产力方向的战略转型,以及序列建模 (Mamba-3) 和模型安全方面的尖端研究。

💡 主要观点

- OpenAI 的 GPT-5.4 mini/nano 发布标志着向高容量、长上下文任务的转变。 新模型具备 40 万 token 的上下文窗口,并在 Codex 中声称提升了 token 效率,尽管对于 API 用户来说价格大幅上涨。

AI 智能体生态系统正朝着“操作系统”级别的集成迈进。 随着 Meta 的 Manus 发布本地 Mac 智能体,以及 Nvidia 宣布 NeMo/Open Shell 沙盒智能体运行时,竞争日益激烈,旨在实现更深层次的系统级自主性。
Mistral 继续通过其 Small 4 系列拥护 MoE 架构。 该新模型系列使用 128 个专家模块,结合了推理、多模态和编码智能体能力,在效率上表现远超其体量。
OpenAI 和 Microsoft 等主要 AI 实验室正在发生战略转移。 据报道,OpenAI 正在转向商业和生产力领域,而 Microsoft 正在重组其 Copilot 和前沿模型工作以保持竞争力。
研究正在超越标准的 Transformer 架构,呈现多样化趋势。 Mamba-3(状态空间原理)和注意力残差等进展表明,行业仍在探索更高效的序列建模技术。

💬 文章金句

- OpenAI 发布了具备 40 万 token 上下文窗口的 GPT-5.4 mini 和 nano……nano 仅限 API 使用,主打高容量分类/数据提取任务。

  • 随着 Meta 收购的 Manus 发布本地 Mac 智能体,智能体“操作系统”竞争加剧。
  • Mistral 开源了 Small 4 模型系列(MoE,总参数 119B/激活参数 6B),结合了推理、多模态和编码智能体能力。
  • 在竞争压力下,OpenAI 将重心转向生产力/企业应用。
  • Mamba-3:使用状态空间原理改进序列建模。

📊 文章信息

AI 评分:86

来源:Last Week in AI

作者:Last Week in AI

分类:人工智能

语言:英文

阅读时间:3 分钟

字数:555

标签: GPT-5.4, Mistral Small 4, AI 智能体, Nvidia GTC, Mamba-3

阅读完整文章

查看原文 → 發佈: 2026-04-01 16:07:15 收錄: 2026-04-01 18:00:33

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。