AI 正在泄露真实的个人电话号码

📌 一句话摘要

AI 聊天机器人因训练数据包含个人信息且防护措施不完善，正频繁泄露真实电话号码、家庭住址等隐私数据，且目前缺乏有效的解决途径。

📝 详细摘要

本文通过多个真实案例揭示了 AI 聊天机器人（如 Gemini、ChatGPT、Claude）泄露个人隐私信息的严重问题。文章指出，由于大语言模型的训练数据来自互联网大规模抓取，其中不可避免地包含了大量个人身份信息（PII），且模型会从训练数据中逐字记忆和复制内容。尽管 AI 公司设置了内容过滤器等防护措施，但这些措施并不总是有效，用户仍能轻易获取他人的私人手机号、家庭住址等敏感信息。文章进一步分析了问题的根源，包括数据中间商向 AI 公司出售数据、现有隐私法律不覆盖已用于训练的公开数据等。最后，文章指出目前没有简单的解决办法，用户难以验证个人信息是否存在于训练集中，也难以要求模型删除这些信息，只能被动地从源头清除公开数据。

💡 主要观点

- AI 聊天机器人因训练数据包含海量个人信息，正频繁泄露真实电话号码等隐私数据。 大语言模型训练数据来自互联网抓取，包含大量个人身份信息（PII），且模型会从训练数据中逐字记忆和复制内容，导致用户可通过简单提示词获取他人隐私。

AI 公司设置的隐私防护措施并不完善，无法有效阻止个人信息泄露。 尽管有内容过滤器和指令约束，但聊天机器人被设计为高效回答问题，与隐私保护存在根本矛盾，导致防护措施经常失效，用户仍能绕过限制获取敏感信息。

目前没有简单的解决办法，用户难以验证和删除已用于训练的个人信息。 现有隐私法律不覆盖已抓取的公开数据，AI 公司缺乏系统性回溯清理机制，用户无法确认自己的信息是否在训练集中，也无法有效要求删除。

💬 文章金句

- AI 公司'可以设置护栏，但聊天机器人同时也被设计成要有效地回答用户的问题。'

你的信息原本只对某个特定群体可见，然后 Gemini 让任何人都能看到。
生成式 AI 是不是直接降低了针对他人的门槛？

📊 文章信息

AI 初评：86

来源：麻省理工科技评论APP

作者：麻省理工科技评论APP

分类：人工智能

语言：中文

阅读时间：16 分钟

字数：3964

标签： AI 隐私, 数据泄露, 大语言模型, Gemini, ChatGPT

阅读完整文章

AI 正在泄露真实的个人电话号码

🤖 問 AI