湖南台 AI 主播骂上热搜，AI 海量“错误”却没人管

📌 一句话摘要

本文以湖南台 AI 主播争议为引，深入剖析 Google AI Overview 功能存在的系统性错误问题，指出其每小时产生超 5700 万条错误信息，且错误形式多样、来源不可靠、难以验证，将搜索引擎从信息策展人转变为不可靠的答案机器。

📝 详细摘要

文章从湖南经视启用 AI 主播「声声」和「双双」引发网友热议切入，指出公众对 AI 在新闻领域的应用存在担忧。随后，文章将焦点转向更普遍的 AI 信息获取场景——搜索引擎。作者引用《纽约时报》委托 AI 初创公司 Oumi 对 Google AI Overview 功能的系统测试结果，揭示了该功能的严重问题：即使在升级到 Gemini 3 后，错误率仍达 9%，考虑到 Google 每年处理超 5 万亿次搜索，这意味着每小时产生超 5700 万条错误信息。文章详细分析了 AI 出错的多种方式，包括直接答错、推断错误、以及找到正确来源却给出相反答案。更令人担忧的是，AI Overview 的答案来源包括 Facebook 和 Reddit 等社交媒体，且超过一半的正确回答无法通过其引用的来源进行验证。此外，该功能还容易被操纵。文章最后指出，核心问题不在于错误率本身，而在于 Google 将不确定的 AI 回答包装成确定答案的设计决策，这种设计削弱了用户的批判性思维，将信息验证的责任转嫁给了用户。

💡 主要观点

- Google AI Overview 功能存在系统性错误，错误率高达 9%，每小时产生超 5700 万条错误信息。 《纽约时报》委托的测试显示，即使升级到 Gemini 3，AI Overview 的错误率仍为 9%。考虑到 Google 庞大的搜索量，这构成了一个规模巨大的信息污染问题。

AI Overview 的错误形式多样，包括直接答错、推断错误和给出与来源相反的答案。 文章列举了多个具体案例，如错误回答马友友是否入选名人堂、错误推断河流位置等，说明 AI 的出错并非单一模式，而是系统性的逻辑缺陷。

AI Overview 的答案来源不可靠，且超过一半的正确回答无法被验证。 测试发现，Facebook 和 Reddit 是 AI Overview 的主要信息来源之一。更严重的是，56% 的正确回答是「无根据的」，即其引用的来源并不完全支持给出的信息，导致用户无法进行逆向验证。

核心问题在于搜索引擎从信息策展人转变为不可靠的答案机器，削弱了用户的批判性思维。 文章认为，AI Overview 将不确定的答案包装成确定的形式，放在最显眼的位置，这种设计决策鼓励用户信任而非质疑，将信息验证的责任转嫁给用户，而用户往往缺乏能力和意愿进行交叉验证。

💬 文章金句

- 它把答案递到你面前，然后建议是，别信。

Google 把一个不确定的回答包装成了确定的样子。
它看起来不像「这里有一些信息供你参考」，而是「这就是答案」。
即使答案是对的，你怎么知道它是对的？你怎么检查？
真正的问题不在于 9% 的错误率本身。真正的问题在于一个设计决策：Google 把一个不确定的回答包装成了确定的样子。

📊 文章信息

AI 初评：85

来源：虎嗅APP

作者：虎嗅APP

分类：人工智能

语言：中文

阅读时间：15 分钟

字数：3509

标签： AI 搜索, Google AI Overview, AI 幻觉, 信息可靠性, AI 伦理

阅读完整文章

湖南台 AI 主播骂上热搜，AI 海量“错误”却没人管

🤖 問 AI