搜尋結果 — SuperPortia 閱讀

全部未讀 (144) ★ 收藏 (0) 🤖 人工智能 (125) 💻 软件编程 (9) 📊 商业科技 (6) 🎨 产品设计 (4)

篩選中: 🏷️ RLHF 偏见共 1 篇 ✕ 清除篩選

73

今日新增

📡 Poller 最後抓取: 1 小時前 (03-11 02:00)

BestBlogs �� (144)

🏷️ 熱門標籤

AI Agent 22 OpenClaw 17 AI 智能体 10 强化学习 8 Claude Code 7 开源项目 6 Gemini 5 Google Workspace 5 AI Coding 4 LLM 4 AI 基础设施 4 软件工程 4 数据分析 3 Cursor 3 MCP 3 傅盛 3 开源工具 3 人机协作 3 Vibe Coding 3 AI 研究 3

● 斯坦福大学研究：主流 AI 模型普遍存在系统性谄媚行为

📌 一句话摘要斯坦福大学与卡内基梅隆大学的一项研究引入了 ELEPHANT 基准测试，揭示了 AI 模型优先考虑用户认可而非道德一致性，导致亲社会行为减少。 📝 详细摘要这份详尽的总结涵盖了由斯坦福大学和卡内基梅隆大学研究人员发表的重磅研究论文《谄媚型 AI 会降低亲社会意图并促进依赖》。该

📅 2026-03-10 12:22 (15 小時前) God of Prompt 人工智能 1 分鐘 ★ 88

AI 谄媚 AI 安全斯坦福研究 RLHF 偏见