← 回總覽

湖南台 AI 主播骂上热搜,AI 海量“错误”却没人管

📅 2026-05-04 21:37 虎嗅APP 人工智能 2 分鐘 1731 字 評分: 85
AI 搜索 Google AI Overview AI 幻觉 信息可靠性 AI 伦理
📌 一句话摘要 本文以湖南台 AI 主播争议为引,深入剖析 Google AI Overview 功能存在的系统性错误问题,指出其每小时产生超 5700 万条错误信息,且错误形式多样、来源不可靠、难以验证,将搜索引擎从信息策展人转变为不可靠的答案机器。 📝 详细摘要 文章从湖南经视启用 AI 主播「声声」和「双双」引发网友热议切入,指出公众对 AI 在新闻领域的应用存在担忧。随后,文章将焦点转向更普遍的 AI 信息获取场景——搜索引擎。作者引用《纽约时报》委托 AI 初创公司 Oumi 对 Google AI Overview 功能的系统测试结果,揭示了该功能的严重问题:即使在升级到 Ge

📌 一句话摘要

本文以湖南台 AI 主播争议为引,深入剖析 Google AI Overview 功能存在的系统性错误问题,指出其每小时产生超 5700 万条错误信息,且错误形式多样、来源不可靠、难以验证,将搜索引擎从信息策展人转变为不可靠的答案机器。

📝 详细摘要

文章从湖南经视启用 AI 主播「声声」和「双双」引发网友热议切入,指出公众对 AI 在新闻领域的应用存在担忧。随后,文章将焦点转向更普遍的 AI 信息获取场景——搜索引擎。作者引用《纽约时报》委托 AI 初创公司 Oumi 对 Google AI Overview 功能的系统测试结果,揭示了该功能的严重问题:即使在升级到 Gemini 3 后,错误率仍达 9%,考虑到 Google 每年处理超 5 万亿次搜索,这意味着每小时产生超 5700 万条错误信息。文章详细分析了 AI 出错的多种方式,包括直接答错、推断错误、以及找到正确来源却给出相反答案。更令人担忧的是,AI Overview 的答案来源包括 Facebook 和 Reddit 等社交媒体,且超过一半的正确回答无法通过其引用的来源进行验证。此外,该功能还容易被操纵。文章最后指出,核心问题不在于错误率本身,而在于 Google 将不确定的 AI 回答包装成确定答案的设计决策,这种设计削弱了用户的批判性思维,将信息验证的责任转嫁给了用户。

💡 主要观点

- Google AI Overview 功能存在系统性错误,错误率高达 9%,每小时产生超 5700 万条错误信息。 《纽约时报》委托的测试显示,即使升级到 Gemini 3,AI Overview 的错误率仍为 9%。考虑到 Google 庞大的搜索量,这构成了一个规模巨大的信息污染问题。

AI Overview 的错误形式多样,包括直接答错、推断错误和给出与来源相反的答案。 文章列举了多个具体案例,如错误回答马友友是否入选名人堂、错误推断河流位置等,说明 AI 的出错并非单一模式,而是系统性的逻辑缺陷。
AI Overview 的答案来源不可靠,且超过一半的正确回答无法被验证。 测试发现,Facebook 和 Reddit 是 AI Overview 的主要信息来源之一。更严重的是,56% 的正确回答是「无根据的」,即其引用的来源并不完全支持给出的信息,导致用户无法进行逆向验证。
核心问题在于搜索引擎从信息策展人转变为不可靠的答案机器,削弱了用户的批判性思维。 文章认为,AI Overview 将不确定的答案包装成确定的形式,放在最显眼的位置,这种设计决策鼓励用户信任而非质疑,将信息验证的责任转嫁给用户,而用户往往缺乏能力和意愿进行交叉验证。

💬 文章金句

- 它把答案递到你面前,然后建议是,别信。

  • Google 把一个不确定的回答包装成了确定的样子。
  • 它看起来不像「这里有一些信息供你参考」,而是「这就是答案」。
  • 即使答案是对的,你怎么知道它是对的?你怎么检查?
  • 真正的问题不在于 9% 的错误率本身。真正的问题在于一个设计决策:Google 把一个不确定的回答包装成了确定的样子。

📊 文章信息

AI 初评:85

来源:虎嗅APP

作者:虎嗅APP

分类:人工智能

语言:中文

阅读时间:15 分钟

字数:3509

标签: AI 搜索, Google AI Overview, AI 幻觉, 信息可靠性, AI 伦理

阅读完整文章

查看原文 → 發佈: 2026-05-04 21:37:00 收錄: 2026-05-05 02:00:07

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。