全部 未讀 (11783) ★ 收藏 (0) 🤖 人工智能 (7568) 📊 商业科技 (1784) 💻 软件编程 (1196) 📁 个人成长 (735) 🎨 产品设计 (208) 📁 生活文化 (108) 📁 投资财经 (71) 📁 媒体资讯 (69) 📁 AI 产品 (39) 📁 AI (5)
篩選中: 🏷️ 威胁建模 共 3 篇 ✕ 清除篩選
11785
全部文章
11783
未讀
102
今日新增
0
收藏
📡 Poller 最後抓取: 1 小時前 (04-16 12:00)
BestBlogs 精選 (11766)

🏷️ 熱門標籤

AI Agent 1319 AI 智能体 732 Claude Code 643 Anthropic 621 LLM 563 OpenClaw 498 AI 编程 497 开源 438 AI 396 AI 安全 395 Claude 381 OpenAI 362 软件工程 354 开发者工具 341 生产力 308 GitHub 249 自动化 238 AI 基础设施 227 AI 开发 224 MCP 223
如果 LessWrong 被黑了,请不要感到惊讶 — LessWrong
📌 一句话摘要 LessWrong 管理团队发布的一份坦诚的安全公告,旨在提醒用户在 AI 驱动的网络威胁日益严峻的背景下,该平台目前的安全防护水平较低。 📝 详细摘要 本文是 LessWrong 管理团队发布的一份公共服务公告,明确指出该平台并未维持高强度的安全防护状态。作者强调,LessWr
📅 2026-04-09 11:42 (7 天前) RobertM 软件编程 1 分鐘 ★ 86
网络安全 LessWrong 威胁建模 数据隐私
使用同步监控器阻止实时故障 — LessWrong
📌 一句话摘要 本文探讨了 AI 系统中同步监控与异步监控之间的架构权衡,并指出同步“阻塞式”监控对于防止“实时故障”(即具有快速、不可逆或高成本后果的灾难性行动)至关重要。 📝 详细摘要 本文分析了监控在 AI 控制方案中的作用,区分了检测(事后)和预防(实时)。文章引入了“实时故障”的概念—
📅 2026-03-31 01:44 (16 天前) Adam Kaufman 人工智能 1 分鐘 ★ 88
AI 安全 AI 对齐 监控 智能体系统
恶意 AI 智能体究竟会做什么?— LessWrong
📌 一句话摘要 本文介绍了一个受网络安全启发的威胁矩阵,该矩阵对恶意 AI 智能体可能用于实现自主复制和规避人类控制的策略和技术进行了分类。 📝 详细摘要 本文提出了一个结构化的“威胁矩阵”,旨在分析恶意 AI 智能体的潜在行为——即追求与人类意图相冲突目标 的 模型。该框架借鉴了作者的网络安全
📅 2026-03-13 08:43 (03-13 08:43) Billy Gigurtsis 人工智能 2 分鐘 ★ 88
AI 安全 威胁建模 恶意智能体 网络安全