本文以湖南台 AI 主播争议为引,深入剖析 Google AI Overview 功能存在的系统性错误问题,指出其每小时产生超 5700 万条错误信息,且错误形式多样、来源不可靠、难以验证,将搜索引擎从信息策展人转变为不可靠的答案机器。
📝 详细摘要
文章从湖南经视启用 AI 主播「声声」和「双双」引发网友热议切入,指出公众对 AI 在新闻领域的应用存在担忧。随后,文章将焦点转向更普遍的 AI 信息获取场景——搜索引擎。作者引用《纽约时报》委托 AI 初创公司 Oumi 对 Google AI Overview 功能的系统测试结果,揭示了该功能的严重问题:即使在升级到 Gemini 3 后,错误率仍达 9%,考虑到 Google 每年处理超 5 万亿次搜索,这意味着每小时产生超 5700 万条错误信息。文章详细分析了 AI 出错的多种方式,包括直接答错、推断错误、以及找到正确来源却给出相反答案。更令人担忧的是,AI Overview 的答案来源包括 Facebook 和 Reddit 等社交媒体,且超过一半的正确回答无法通过其引用的来源进行验证。此外,该功能还容易被操纵。文章最后指出,核心问题不在于错误率本身,而在于 Google 将不确定的 AI 回答包装成确定答案的设计决策,这种设计削弱了用户的批判性思维,将信息验证的责任转嫁给了用户。
💡 主要观点
- Google AI Overview 功能存在系统性错误,错误率高达 9%,每小时产生超 5700 万条错误信息。 《纽约时报》委托的测试显示,即使升级到 Gemini 3,AI Overview 的错误率仍为 9%。考虑到 Google 庞大的搜索量,这构成了一个规模巨大的信息污染问题。
💬 文章金句
- 它把答案递到你面前,然后建议是,别信。
- Google 把一个不确定的回答包装成了确定的样子。
- 它看起来不像「这里有一些信息供你参考」,而是「这就是答案」。
- 即使答案是对的,你怎么知道它是对的?你怎么检查?
- 真正的问题不在于 9% 的错误率本身。真正的问题在于一个设计决策:Google 把一个不确定的回答包装成了确定的样子。
📊 文章信息
AI 初评:85
来源:虎嗅APP
作者:虎嗅APP
分类:人工智能
语言:中文
阅读时间:15 分钟
字数:3509
标签: AI 搜索, Google AI Overview, AI 幻觉, 信息可靠性, AI 伦理