📡 Poller 最後抓取: 34 分鐘前 (06-09 04:00)
BestBlogs 精選 (21669)
🏷️ 熱門標籤
● 吃透大模型 SFT 底层机理:终结实践争议,规避无效算力
● 上交 x 创智 x 瑞金联合发布 CX-Mind:胸片诊断进入“可验证推理”时代
● 大语言模型为什么能像人一样说话和思考?
● Claude 脑子里想的,被翻译成人话了!Anthropic 新研究看懵人类
● 在 Anthropic 的读心术之外,大模型黑盒迎来了真正的法医 | Hao 好聊论文
● Anthropic 新作:我们撬开了 LLM 思考黑盒!
📅 2026-05-09 11:22 (05-09 11:22) PaperAgent 人工智能 1 分鐘 ★ 82
● Claude 思考黑箱终结了!Anthropic 祭出 AI 读心术:揭秘 Claude 的隐藏想法!
● Anthropic 出手!AI 的内心独白,曝光了
● Anthropic 最新论文撬开大模型黑箱:隐藏动机发现率提升 4 倍以上
● 论文解读:角色扮演法为何有效——LLM 中的「粒度轴」
📅 2026-05-08 12:20 (05-08 12:20) 李继刚 人工智能 1 分鐘 ★ 87
● AI 模型是个黑箱,这家公司造了一把能打开它的钥匙
● Anthropic 最新论文:检测 LLM 内省意识的方法
● Qwen 开源 Qwen-Scope:稀疏自编码器完整套件,模型可解释性工具
📅 2026-04-30 23:00 (04-30 23:00) Berryxia.AI 人工智能 1 分鐘 ★ 80
● ACL 2026 综述:从事后解释到内生解释,大模型内生可解释性的前沿进展
● 荣登 Science!大模型竞争的下一个关键变量
● 不可理解性源于我们:关于思维链的笔记 — LessWrong
● 基于非对称辩论与监控的 AI 对齐研究议程 — LessWrong
● 线性与非线性探针在可解释性研究中的对比 — LessWrong
📅 2026-04-10 12:44 (04-10 12:44) NickyP 人工智能 1 分鐘 ★ 87
● 拥有多个目标的智能体如何选择目标?— LessWrong
● 像研究外星物种一样评估 AI 模型:Claude Mythos 的可解释性洞察
📅 2026-04-08 07:59 (04-08 07:59) AI Breakfast 人工智能 1 分鐘 ★ 82