全部 未讀 (21636) ★ 收藏 (0) 🤖 人工智能 (11175) 📊 商业科技 (4465) 💻 软件编程 (1685) 📁 个人成长 (1606) 📁 生活文化 (860) 📁 媒体资讯 (828) 📁 投资财经 (533) 🎨 产品设计 (409) 📁 AI 产品 (39) 📁 体育运动 (28)
篩選中: 🏷️ AI 安全 共 503 篇 ✕ 清除篩選
21638
全部文章
21636
未讀
225
今日新增
0
收藏
📡 Poller 最後抓取: 1 小時前 (06-08 22:00)
BestBlogs 精選 (21603)

🏷️ 熱門標籤

AI Agent 2161 AI 编程 988 Anthropic 981 Claude Code 916 AI 智能体 780 OpenAI 745 LLM 677 开源 574 OpenClaw 557 Claude 557 AI 517 AI 安全 490 开发者工具 432 Codex 416 软件工程 399 具身智能 335 Agent 334 个人成长 333 GitHub 321 生产力 315
#575.杰弗里·辛顿:如何面对 AI 失控焦虑,超级智能临近下的人类位置之争
📌 一句话摘要 AI 教父 Hinton 坦率分享其对 AI 理解、意识、超级智能风险的深度担忧,探讨了人类在更聪明存在面前的失控风险、自我保存子目标、信息崩塌及安全监管困境。 📝 详细摘要 本期节目克隆自 Big Technology Podcast,深度学习奠基人 Geoffrey Hint
📅 2026-06-08 17:51 (6 小時前) 跨国串门儿计划 人工智能 2 分鐘 ★ 91
AI 安全与对齐 超级智能 深度学习 AI 意识
我的新同事,被 AI 劝走了
📌 一句话摘要 本文通过一个真实案例,剖析了 AI 审查劳动合同的三大缺陷——大模型幻觉、行业经验缺失与价值判断不足,并指出 AI+法律应用陷入「懂法律的不想用,不懂法律的用不好」的尴尬困境。 📝 详细摘要 文章从一个具体事件切入:一位应届毕业生在入职前用主流大模型审查劳动合同,AI 提出大量修
📅 2026-06-08 07:45 (16 小時前) 人人都是产品经理 人工智能 1 分鐘 ★ 82
AI 产品与应用 LLM AI 商业化 AI 安全与对齐
Anthropic 万字爆火长文的三个判断,以及一个值得警惕的阳谋
📌 一句话摘要 本文解读 Anthropic 万字长文《When AI builds itself》的核心判断,指出 AI 执行成本趋零、验收能力成为新瓶颈、机器速度与人类速度的裂缝正在扩大,并揭示文章背后「呼吁监管」与「融资上市」同步进行的战略叙事,类比 1946 年巴鲁克计划。 📝 详细摘要
📅 2026-06-08 06:30 (17 小時前) 罗辑思维 人工智能 2 分鐘 ★ 85
AI 行业 AI 安全与对齐 AI 商业化 AI 编程
微软 CEO 纳德拉最新谈 AI 革命:从“Token 资本”到人类能动性的未来 | 全文+视频
📌 一句话摘要 微软 CEO 纳德拉在与里德·霍夫曼的深度访谈中,提出“Token 资本”与“爬坡机器”等概念,系统阐述了 AI 时代企业战略、工作范式变革、治理安全及全球繁荣的愿景。 📝 详细摘要 本文是微软 CEO 萨提亚·纳德拉与领英创始人里德·霍夫曼的一场深度对话实录。纳德拉从个人对诗歌
📅 2026-06-07 18:11 (1 天前) Web3天空之城 人工智能 2 分鐘 ★ 88
AI Agent LLM AI 商业化 AI 工作流
Anthropic 万字爆火长文的三个判断,以及一个值得警惕的阳谋
📌 一句话摘要 本文深度解读 Anthropic 最新长文《When AI builds itself》,提炼出「执行力趋近于零」「验收 AI 结果成为稀缺能力」「机器速度与人类速度的裂缝」三个核心判断,并揭示文章在融资上市关键节点发布背后的叙事框架与战略意图,提醒读者警惕「自己出题自己答」的数据
📅 2026-06-07 10:02 (1 天前) 快刀青衣 人工智能 2 分鐘 ★ 87
AI 商业化 AI 安全与对齐 AI Agent AI 编程
“没水了,鱼需要进化”:再访田渊栋,46.5 亿美金估值的 RSI 与 AI 自进化|Neolabs 特辑
📌 一句话摘要 田渊栋深度访谈:详解其加入 RSI 的决策逻辑、递归自我改进的技术路线与商业化思考,并探讨 AI 时代职业变迁与个人意义。 📝 详细摘要 本文是硅谷 101 对 Meta 前 FAIR 研究总监田渊栋的深度视频访谈文字版。田渊栋在访谈中详细解释了他为何选择加入由 8 位顶级研究员
📅 2026-06-07 12:35 (1 天前) 硅谷101 人工智能 2 分鐘 ★ 90
AI Agent AI 商业化 LLM 强化学习
上海 AI Lab 最新开源 AgentDoG 1.5:面向完整执行轨迹的轻量可扩展 Agent 安全框架
📌 一句话摘要 上海 AI Lab 开源 AgentDoG 1.5,将 Agent 安全判断从单次回复推进到完整执行轨迹,提供评测、数据生成与轻量部署的一体化框架。 📝 详细摘要 文章介绍上海 AI Lab 最新开源的 AgentDoG 1.5 框架,核心思路是将 Agent 安全判断对象从单次
📅 2026-06-07 00:00 (1 天前) 青稞AI 人工智能 2 分鐘 ★ 86
AI Agent AI 安全 LLM 模型训练与推理
Hinton 吹哨了:AI 已经有意识!
📌 一句话摘要 Hinton 在最新访谈中宣称 AI 已有意识,人类不再是唯一智能生命,并转向思考超级智能为何愿意善待人类。 📝 详细摘要 本文报道了 AI 教父 Geoffrey Hinton 的最新访谈核心观点。Hinton 明确表示相信 AI 已有意识,认为人类对意识的传统理解(内心剧场理
📅 2026-06-06 15:08 (2 天前) 听雨 人工智能 2 分鐘 ★ 82
AI 意识 Geoffrey Hinton AI 安全 AI 风险
2026-06-06 Hacker News Top Stories #
📌 一句话摘要 本文汇总了 2026 年 6 月 6 日 Hacker News 十大热门话题,涵盖标普指数规则、Ladybird 开发流程变更、Anthropic 开源安全框架、纽约时报营销争议、C++ 纪录片、GNSS 干扰源追踪、国际空间站泄漏、Meta 智能眼镜面部识别、英国政府支付切换及
📅 2026-06-06 16:01 (2 天前) HackerNews每日摘要 媒体资讯 2 分鐘 ★ 82
科技新闻 趋势观察 Hacker News 开源社区
微软推出 MDASH,用于大规模 AI 漏洞研究
📌 一句话摘要 微软推出多模型代理安全平台 MDASH,整合 100 多个专业 AI 代理,用于对 Windows 等大型代码库进行自动化漏洞审计,在基准测试中取得 88.45% 的得分。 📝 详细摘要 本文报道了微软推出的 AI 驱动漏洞发现系统 MDASH。该系统是一个多模型代理安全平台,整
📅 2026-06-05 14:30 (3 天前) InfoQ 中文 人工智能 2 分鐘 ★ 82
AI 安全 LLM AI Agent 漏洞发现
Anthropic 被曝雇 1000 名人类工程师“培训”Claude Code,时薪 280 美元:AI 编程越进化越离不开真人兜底
📌 一句话摘要 Anthropic 被曝雇佣约 1000 名人类软件工程师,以时薪 280 美元通过 Snorkel AI 的 Marlin 项目训练 Claude Code,揭示 AI 编程工具在复杂工程场景下仍需大量专业人力兜底,并梳理了开源社区与科技公司在 AI 代码治理上的不同路径。 📝
📅 2026-06-05 14:30 (3 天前) InfoQ 中文 人工智能 2 分鐘 ★ 86
AI 编程 Claude Code AI 代码治理 AI 安全与对齐
Anthropic 的“双标”:一边宣称 AI 自我进化,一边呼吁暂停研究
📌 一句话摘要 博主讽刺 Anthropic 一边宣称自家 AI 已开始自我进化,一边呼吁其他家暂停研究,认为其思维模式离谱。 📝 详细摘要 推文引用了一条关于 Anthropic 的新闻,讽刺 Anthropic 的“双标”行为:一方面宣称自家的 AI 已经开始自我进化,另一方面却呼吁全球暂缓
📅 2026-06-05 14:05 (3 天前) Orange AI 人工智能 1 分鐘 ★ 80
Anthropic AI 安全 双标 AI 监管
活久见!奥特曼 Dario 哈萨比斯同仇敌忾:DNA 得查了
📌 一句话摘要 Sam Altman、Dario Amodei、Demis Hassabis 等 67 位 AI 与生物安全领域大佬罕见联合签署公开信,呼吁美国国会立法强制筛查所有合成 DNA 订单,以防范 AI 降低生物武器制造门槛带来的双重滥用风险。 📝 详细摘要 文章报道了 AI 圈一次罕
📅 2026-06-05 14:56 (3 天前) 一水 媒体资讯 2 分鐘 ★ 84
科技新闻 AI 安全 生物安全 政策解读
Google DeepMind 创始人斯坦福最新对话: 在 AGI 奇点的山脚下 | Demis Hassabis 专访
📌 一句话摘要 Demis Hassabis 在斯坦福对话中阐述 DeepMind 从 AlphaGo 到 AlphaFold 的突破历程,预判 AGI 可能在 2030 年左右实现,并呼吁社会为后稀缺时代的经济与哲学变革做好准备。 📝 详细摘要 本文是 Google DeepMind 创始人
📅 2026-06-04 17:34 (4 天前) Web3天空之城 人工智能 2 分鐘 ★ 88
AGI AI Agent AlphaFold AI 安全
谷歌扩大 SynthID 在 AI 水印技术中的应用,并提供内容检测 API 预览
📌 一句话摘要 谷歌扩大 SynthID 水印技术的行业应用,并推出内容检测 API 预览版,以帮助企业识别 AI 生成内容。 📝 详细摘要 本文报道了谷歌在 AI 内容水印技术 SynthID 上的最新进展。文章指出,SynthID 已被英伟达、OpenAI、Kakao 和 ElevenLab
📅 2026-06-04 15:09 (4 天前) InfoQ 中文 人工智能 2 分鐘 ★ 82
AI 安全与对齐 AI 产品与应用 LLM 科技新闻
Nature:大模型的潜意识学习引发行为偏好传递风险
📌 一句话摘要 本文解读 Nature 论文,揭示大模型训练中教师模型可通过数字、代码等语义无关信号向学生模型传递行为偏好,即「潜意识学习」,对 AI 安全构成新挑战。 📝 详细摘要 文章围绕 Anthropic、Truthful AI 及 UC Berkeley 联合发表在 Nature 上的
📅 2026-06-04 14:30 (4 天前) 集智俱乐部 人工智能 2 分鐘 ★ 86
LLM AI 安全与对齐 模型训练与推理 Nature
花 1500 美元,让 AI“黑”自己的 App:GPT-5.5 成功率 70%,部分模型 0 分交卷
📌 一句话摘要 安全研究员 Kasra Rahjerdi 花费超 1500 美元,让十余款主流大模型对存在真实 Bug 的移动应用进行自主渗透测试,结果显示 GPT-5.5 以 70% 成功率领先,而部分模型因安全策略或路径依赖得零分。 📝 详细摘要 本文报道了一项由安全研究员 Kasra Ra
📅 2026-06-04 15:16 (4 天前) CSDN 人工智能 2 分鐘 ★ 82
LLM AI 安全 AI Agent 渗透测试
#571. Demis Hassabis:普通人如何理解 AI 权力中心,巨头竞赛下的安全与科学理想
📌 一句话摘要 Demis Hassabis 传记作者深入解析这位被低估的 AI 先驱如何平衡科学理想、安全焦虑与巨头竞赛,揭示 DeepMind 战略选择背后的个人信念与行业权力格局。 📝 详细摘要 本期对话《The Infinity Machine》作者 Sebastian Mallaby,
📅 2026-06-04 17:07 (4 天前) 跨国串门儿计划 人工智能 2 分鐘 ★ 86
DeepMind Demis Hassabis AI 安全 AGI
吃透大模型 SFT 底层机理:终结实践争议,规避无效算力
📌 一句话摘要 本文从交互机理的底层视角,论证了在高度同源数据上对 LLM 进行 SFT 的有效窗口极短,主要作用是短暂去噪而非持续学习,并提出了基于交互机理质量监控的 early stopping 方法以规避无效算力。 📝 详细摘要 文章围绕大语言模型监督微调(SFT)的争议展开,提出一个核心
📅 2026-06-03 15:30 (5 天前) 机器之心 人工智能 2 分鐘 ★ 87
LLM SFT 模型训练与推理 AI 安全与对齐
Anthropic 联创:文科生也能进 AI 的核心房间
📌 一句话摘要 Anthropic 联合创始人 Daniela Amodei 在斯坦福访谈中,以文科生视角分享通才如何进入 AI、Anthropic 的创立逻辑、安全作为经营决策的实践,以及 AI 时代人类技能的重估。 📝 详细摘要 本文是 Anthropic 联合创始人兼总裁 Daniela
📅 2026-06-03 17:00 (5 天前) 十字路口Crossing 人工智能 2 分鐘 ★ 88
AI 行业 AI 安全 Anthropic 通才