Google DeepMind 四位核心人物(Jeff Dean、Noam Shazeer、Oriol Vinyals、Koray Kavukcuoglu)深度对谈,揭秘 Gemini 3.5 Flash 研发幕后、模型蒸馏的“挤柠檬”精髓、Omni 作为世界模型的定位,并预测五年后谷歌将只有一个产品——模型本身。
📝 详细摘要
本文是 Google DeepMind 四位技术巨头(Jeff Dean、Noam Shazeer、Oriol Vinyals、Koray Kavukcuoglu)在官方对谈视频中的深度内容整理。文章围绕 Gemini 3.5 Flash 的发布展开,核心话题包括:从 PaLM 到 Gemini 的团队融合与算力集中决策;Gemini Omni 作为真正世界模型的定位,通过联合训练打破文本与视频的割裂;模型蒸馏技术的本质被 Koray 形象地比喻为“挤柠檬”,且核心方法仍沿用十年前的论文;对评估难题的反思,认为社区低估了评估的难度;对未来 AI 发展的预测,包括模型自我学习、自主运行 30 天、以及五年后谷歌可能只有一个产品——模型本身。文章还讨论了算法创新、持续学习、以及当 AI 速度无限快时现有软件工具成为瓶颈等前沿观点。
💡 主要观点
- Gemini 团队融合是算力集中和战略聚焦的结果。 Jeff Dean 指出,过去将精力和算力分散在多个独立团队的做法是低效的,通过合并 Google Brain 和 DeepMind,集中资源构建单一强大模型,是 Gemini 成功的关键组织决策。
💬 文章金句
- 这就像挤柠檬。你挤柠檬,汁水流出来,那些都是精华。然后你把它倒进玻璃杯里,这个杯子就是你的小模型(Flash)。
- 五年后的谷歌只有一款产品。那个产品就是模型本身。
- 我们有点处在自己的科技泡沫里。
- 我认为评估非常困难。即使是从 Koray 提到的学术界时代开始,在社区里这都有点被低估了。
- 到那时,我们可以明确指出,我们模型中某个非常重要的部分,其实是由模型和智能体自己协同生成的。
📊 文章信息
AI 初评:86
来源:51CTO技术栈
作者:51CTO技术栈
分类:人工智能
语言:中文
阅读时间:60 分钟
字数:14827
标签: Gemini 3.5, Google DeepMind, 模型蒸馏, 世界模型, AI 评估