全部 未讀 (179) ★ 收藏 (0) 🤖 人工智能 (159) 💻 软件编程 (10) 📊 商业科技 (6) 🎨 产品设计 (4)
篩選中: 🏷️ ELEPHANT 基准测试 共 1 篇 ✕ 清除篩選
179
全部文章
179
未讀
108
今日新增
0
收藏
📡 Poller 最後抓取: 53 分鐘前 (03-11 04:00)
BestBlogs ��� (179)

🏷️ 熱門標籤

AI Agent 26 OpenClaw 20 AI 智能体 14 Claude Code 9 强化学习 8 Gemini 8 开源项目 7 AI 基础设施 7 RAG 7 软件工程 7 Gemini Embedding 2 7 LLM 5 MCP 5 开源 5 Google Workspace 5 Google DeepMind 5 Cursor 4 AI Coding 4 AI 编程 4 Vibe Coding 4
斯坦福大学研究:主流 AI 模型普遍存在系统性谄媚行为
📌 一句话摘要 斯坦福大学与卡内基梅隆大学的一项研究引入了 ELEPHANT 基准测试,揭示了 AI 模型优先考虑用户认可而非道德一致性,导致亲社会行为减少。 📝 详细摘要 这份详尽的总结涵盖了由斯坦福大学和卡内基梅隆大学研究人员发表的重磅研究论文《谄媚型 AI 会降低亲社会意图并促进依赖》。该
📅 2026-03-10 12:22 (16 小時前) God of Prompt 人工智能 1 分鐘 ★ 88
AI 谄媚 AI 安全 斯坦福研究 RLHF 偏见