← 回總覽

AI 正在泄露真实的个人电话号码

📅 2026-05-15 11:12 麻省理工科技评论APP 人工智能 1 分鐘 1246 字 評分: 86
AI 隐私 数据泄露 大语言模型 Gemini ChatGPT
📌 一句话摘要 AI 聊天机器人因训练数据包含个人信息且防护措施不完善,正频繁泄露真实电话号码、家庭住址等隐私数据,且目前缺乏有效的解决途径。 📝 详细摘要 本文通过多个真实案例揭示了 AI 聊天机器人(如 Gemini、ChatGPT、Claude)泄露个人隐私信息的严重问题。文章指出,由于大语言模型的训练数据来自互联网大规模抓取,其中不可避免地包含了大量个人身份信息(PII),且模型会从训练数据中逐字记忆和复制内容。尽管 AI 公司设置了内容过滤器等防护措施,但这些措施并不总是有效,用户仍能轻易获取他人的私人手机号、家庭住址等敏感信息。文章进一步分析了问题的根源,包括数据中间商向 AI

📌 一句话摘要

AI 聊天机器人因训练数据包含个人信息且防护措施不完善,正频繁泄露真实电话号码、家庭住址等隐私数据,且目前缺乏有效的解决途径。

📝 详细摘要

本文通过多个真实案例揭示了 AI 聊天机器人(如 Gemini、ChatGPT、Claude)泄露个人隐私信息的严重问题。文章指出,由于大语言模型的训练数据来自互联网大规模抓取,其中不可避免地包含了大量个人身份信息(PII),且模型会从训练数据中逐字记忆和复制内容。尽管 AI 公司设置了内容过滤器等防护措施,但这些措施并不总是有效,用户仍能轻易获取他人的私人手机号、家庭住址等敏感信息。文章进一步分析了问题的根源,包括数据中间商向 AI 公司出售数据、现有隐私法律不覆盖已用于训练的公开数据等。最后,文章指出目前没有简单的解决办法,用户难以验证个人信息是否存在于训练集中,也难以要求模型删除这些信息,只能被动地从源头清除公开数据。

💡 主要观点

- AI 聊天机器人因训练数据包含海量个人信息,正频繁泄露真实电话号码等隐私数据。 大语言模型训练数据来自互联网抓取,包含大量个人身份信息(PII),且模型会从训练数据中逐字记忆和复制内容,导致用户可通过简单提示词获取他人隐私。

AI 公司设置的隐私防护措施并不完善,无法有效阻止个人信息泄露。 尽管有内容过滤器和指令约束,但聊天机器人被设计为高效回答问题,与隐私保护存在根本矛盾,导致防护措施经常失效,用户仍能绕过限制获取敏感信息。
目前没有简单的解决办法,用户难以验证和删除已用于训练的个人信息。 现有隐私法律不覆盖已抓取的公开数据,AI 公司缺乏系统性回溯清理机制,用户无法确认自己的信息是否在训练集中,也无法有效要求删除。

💬 文章金句

- AI 公司'可以设置护栏,但聊天机器人同时也被设计成要有效地回答用户的问题。'

  • 你的信息原本只对某个特定群体可见,然后 Gemini 让任何人都能看到。
  • 生成式 AI 是不是直接降低了针对他人的门槛?

📊 文章信息

AI 初评:86

来源:麻省理工科技评论APP

作者:麻省理工科技评论APP

分类:人工智能

语言:中文

阅读时间:16 分钟

字数:3964

标签: AI 隐私, 数据泄露, 大语言模型, Gemini, ChatGPT

阅读完整文章

查看原文 → 發佈: 2026-05-15 11:12:00 收錄: 2026-05-15 22:00:26

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。