← 回總覽

Hassabis 狂赞!谷歌爆改 50 年鼠标,指哪 AI 打哪,连提示词都省了

📅 2026-05-15 08:02 新智元 人工智能 2 分鐘 1483 字 評分: 86
Google DeepMind AI-enabled pointer 人机交互 Gemini AI 产品
📌 一句话摘要 Google DeepMind 发布由 Gemini 驱动的 AI-enabled pointer 实验原型,通过将鼠标指针与语义理解结合,实现指向即交互,省去复制粘贴和提示词编写等上下文解释步骤。 📝 详细摘要 文章报道了 Google DeepMind 最新发布的实验性原型「AI-enabled pointer」,这是一个由 Gemini 模型驱动的智能鼠标指针系统。其核心设计理念是「AI 应该来找你,而不是你去找 AI」,旨在解决当前 AI 工具需要用户频繁切换窗口、复制粘贴、编写提示词来解释上下文的痛点。系统基于四个设计原则:保持流畅(Maintain the fl

📌 一句话摘要

Google DeepMind 发布由 Gemini 驱动的 AI-enabled pointer 实验原型,通过将鼠标指针与语义理解结合,实现指向即交互,省去复制粘贴和提示词编写等上下文解释步骤。

📝 详细摘要

文章报道了 Google DeepMind 最新发布的实验性原型「AI-enabled pointer」,这是一个由 Gemini 模型驱动的智能鼠标指针系统。其核心设计理念是「AI 应该来找你,而不是你去找 AI」,旨在解决当前 AI 工具需要用户频繁切换窗口、复制粘贴、编写提示词来解释上下文的痛点。系统基于四个设计原则:保持流畅(Maintain the flow)、指给它看(Show and tell)、拥抱「这个」和「那个」的力量(Embrace the power of This and That)、让像素变成可操作的实体(Turn pixels into actionable entities)。通过结合光标位置、语音指令和屏幕内容,系统能理解用户的自然指向意图,无需用户费力描述上下文。目前已在 Google AI Studio 开放图片编辑和地图找地点两个 Demo。文章将这一创新置于人机交互史中,认为其意义堪比键盘、鼠标和触屏,标志着交互范式从「人主动表达」向「机器主动理解」的转变。

💡 主要观点

- AI-enabled pointer 旨在消除用户向 AI 解释上下文的摩擦。 当前 AI 工具需要用户频繁切换窗口、复制粘贴和编写提示词来告知 AI 当前工作内容,造成严重的认知中断。该原型通过让 AI 理解用户正在看什么,直接省去这一步骤。

系统通过「指向」+「语音」+「语义理解」实现自然意图传达。 用户不再需要精确描述,只需用鼠标或头部追踪指向目标,配合「这个」「那里」等自然语言指令,Gemini 即可结合视觉和语义上下文理解用户意图,实现「指哪打哪」。
该原型标志着人机交互从「人主动表达」向「机器主动理解」的范式转变。 从键盘、鼠标到触屏,前四代交互都要求人主动将意图翻译成机器能理解的形式。AI-enabled pointer 首次让机器主动理解用户的指向和上下文,压缩了「解释上下文」这一环节。

💬 文章金句

- AI 应该来找你,而不是你去找 AI。

  • 提示词的本质一直都不是文字,而是意图。现在,意图终于可以用最短的方式传达了。
  • 前四代交互都是「人主动表达」。这一代第一次是「机器主动理解」。
  • 最好用的工具,往往是你忘记它存在的那种。

📊 文章信息

AI 初评:86

来源:新智元

作者:新智元

分类:人工智能

语言:中文

阅读时间:13 分钟

字数:3207

标签: Google DeepMind, AI-enabled pointer, 人机交互, Gemini, AI 产品

阅读完整文章

查看原文 → 發佈: 2026-05-15 08:02:00 收錄: 2026-05-15 18:00:26

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。