搜尋結果 — SuperPortia 閱讀

全部未讀 (763) ★ 收藏 (0) 🤖 人工智能 (647) 📊 商业科技 (54) 💻 软件编程 (49) 🎨 产品设计 (8) 📁 AI 产品 (6)

篩選中: 🏷️ Gemma 3 共 1 篇 ✕ 清除篩選

81

今日新增

📡 Poller 最後抓取: 1 小時前 (03-13 02:00)

BestBlogs 精選 (764)

🏷️ 熱門標籤

AI Agent 127 OpenClaw 61 AI 智能体 51 Anthropic 33 Claude Code 32 软件工程 31 AI 基础设施 30 开发者工具 28 AI 安全 25 RAG 25 软件开发 24 LLM 22 OpenAI 22 Gemini 18 开源 17 AI 编程 16 生成式 AI 16 CLI 16 MCP 15 强化学习 15

● 通过转向操控选择性降低 Gemma 3 27B 的评估意识和谋杀意图 — LessWrong

📌 一句话摘要本文探讨了利用稀疏自编码器 (SAEs) 识别并操控 Gemma 3 27B 中与评估意识和有害意图相关的特征，揭示了关于模型诚实性以及在较小模型中进行操控的局限性。 📝 详细摘要作者使用稀疏自编码器 (SAEs) 对 Google 的 Gemma 3 27B 模型进行了可解释

📅 2026-03-11 03:51 (1 天前) Matthias Murdych 人工智能 2 分鐘 ★ 82

Gemma 3 稀疏自编码器模型操控 AI 安全