全部 未讀 (11821) ★ 收藏 (0) 🤖 人工智能 (7594) 📊 商业科技 (1791) 💻 软件编程 (1198) 📁 个人成长 (736) 🎨 产品设计 (209) 📁 生活文化 (109) 📁 投资财经 (71) 📁 媒体资讯 (69) 📁 AI 产品 (39) 📁 AI (5)
篩選中: 🏷️ GPT-2 共 5 篇 ✕ 清除篩選
11823
全部文章
11821
未讀
140
今日新增
0
收藏
📡 Poller 最後抓取: 34 分鐘前 (04-16 14:00)
BestBlogs 精選 (11804)

🏷️ 熱門標籤

AI Agent 1324 AI 智能体 734 Claude Code 645 Anthropic 622 LLM 563 AI 编程 501 OpenClaw 498 开源 439 AI 安全 396 AI 396 Claude 384 OpenAI 362 软件工程 354 开发者工具 343 生产力 308 GitHub 251 自动化 238 AI 基础设施 227 AI 开发 225 MCP 223
历史回顾:OpenAI 关于 GPT-2 “危险性”的争议重回热搜
📌 一句话摘要 回顾 2019 年的一篇文章,讨论 OpenAI 当时因安全担忧而决定不发布 GPT-2 的往事,该话题目前正登上 Hacker News 热榜。 📝 详细摘要 推文指向了目前在 Hacker News 上热门的一篇 2019 年 Slate 文章。该文章讨论了 OpenAI 当
📅 2026-04-08 11:25 (8 天前) Peter Steinberger 🦞 商业科技 1 分鐘 ★ 76
OpenAI GPT-2 AI 安全 Hacker News
对 AI 模型发布限制的评论
📌 一句话摘要 Hugging Face 首席技术官 Julien Chaumond 讽刺地将当前的 AI 安全担忧与当年 GPT-2 Large 发布时过度谨慎的历史情况进行了类比。 📝 详细摘要 Hugging Face 首席技术官 Julien Chaumond 通过简短且带有讽刺意味的评
📅 2026-04-08 02:51 (8 天前) Julien Chaumond 人工智能 1 分鐘 ★ 76
AI 安全 开源 AI 模型发布 GPT-2
GPT-2 是否存在“恐惧方向”?—— LessWrong
📌 一句话摘要 一项独立调查,旨在探究 Anthropic 在 Claude Sonnet 4.5 研究中发现的“恐惧方向”是否存在于 GPT-2 等较小的模型中。研究发现,虽然这种表征确实存在,但行为引导受到模型能力的限制。 📝 详细摘要 作者尝试使用 GPT-2 复现 Anthropic 关
📅 2026-04-04 07:08 (12 天前) seanmagee 人工智能 1 分鐘 ★ 86
机械可解释性 GPT-2 激活引导 AI 安全
别被机器人跳舞骗了,我们还在 GPT-2 时代| 具身智能百亿圆桌
📌 一句话摘要 2026 年中关村论坛具身智能圆桌会议指出,行业正处于类似大语言模型的 GPT-2 阶段,面临真实场景数据匮乏的瓶颈,正从实验室 Demo 转向物流、零售等具备容错性的商业化落地场景。 📝 详细摘要 本文记录了 2026 年中关村论坛上五位国内具身智能领军人物的深度对话。核心观点
📅 2026-03-27 23:10 (19 天前) 张子豪 人工智能 1 分鐘 ★ 86
具身智能 机器人 GPT-2 时代 数据瓶颈
让黑盒不再那么晦涩(第三部分)—— LessWrong
📌 一句话摘要 一项使用稀疏自动编码器(SAE)的比较性机械可解释性研究,旨在分析模型规模(GPT-2 Small 对比 Gemma 2 9b)如何影响专家特征行为和表征几何结构。 📝 详细摘要 本文是该系列的第三篇,通过对比 GPT-2 Small (124M) 和 Gemma 2 9b,探讨
📅 2026-03-26 09:41 (21 天前) Matthew McDonnell 人工智能 1 分鐘 ★ 88
机械可解释性 稀疏自动编码器 LLM 分析 Gemma 2