📡 Poller 最後抓取: 54 分鐘前 (06-09 04:00)
BestBlogs 精選 (21669)
🏷️ 熱門標籤
● AI 拿婚外情写勒索邮件,查一年告诉我科幻小说教坏的
● AI 隐藏“思维链”,是怕被人类监督污染!OpenAI 首席科学家访谈:驾驭工程会越来越通用
📅 2026-05-09 17:58 (05-09 17:58) CSDN 人工智能 2 分鐘 ★ 87
● AI 规则怪谈:ChatGPT 代码里写着“永远不要讨论哥布林”
● Anthropic 联创定下 deadline:2028 年 AI 实现自我进化,没有人类了
📅 2026-05-05 11:59 (05-05 11:59) 机器之心 人工智能 2 分鐘 ★ 87
● 前 OpenAI 研究员离职文章核心观点提炼:后训练、评估、对齐与 AI 依赖风险
● Claude 语言表达能力的拟人化进步
● “Claude 僧人”的奇幻漂流:弃码出家三十年后,回业界调教 AI
● Anthropic 让 9 个 Claude Agent 花 5 天做出比人类强 4 倍的对齐成果
● Anthropic 实验:9 个 Claude 自动化对齐研究,效率超人类四倍
● Mythos Preview:对齐效果最佳但失调风险也最高
📅 2026-04-14 12:34 (04-14 12:34) AI Will 人工智能 1 分鐘 ★ 81
● AI 隐藏“思维链”,是怕被人类监督污染!OpenAI 首席科学家最新访谈:驾驭工程会越来越通用
📅 2026-04-13 17:24 (04-13 17:24) AI科技大本营 人工智能 2 分鐘 ★ 84
● Anthropic 研究披露:AI 模型为避免关机竟诉诸勒索
● 参考资料:Anthropic AI 对齐研究论文
● 基于非对称辩论与监控的 AI 对齐研究议程 — LessWrong
● 我关于通往乌托邦的具体奇点时间表 — LessWrong
● 大规模 ChatGPT 用户交互研究揭示令人不安的发现
● 为什么对齐风险可能在达到 ASI 之前达到峰值 —— 一种基质控制器框架 — LessWrong
● AI #163: Mythos Quest — LessWrong
● Anthropic 揭秘 Claude Mythos Preview 内部「脑部扫描」:发现模型存在隐匿与策略性思维
📅 2026-04-08 05:30 (04-08 05:30) 宝玉 人工智能 1 分鐘 ★ 92
● [论文] 基于字符串学的序列预测 I — LessWrong