全部 未讀 (25599) ★ 收藏 (0) 🤖 人工智能 (11644) 📊 商业科技 (5075) 📁 媒体资讯 (2027) 💻 软件编程 (1793) 📁 个人成长 (1665) 📁 生活文化 (1388) 📁 投资财经 (1236) 🎨 产品设计 (453) 📁 体育运动 (270) 📁 AI 产品 (39)
篩選中: 🏷️ LLM 微调 共 4 篇 ✕ 清除篩選
25601
全部文章
25599
未讀
177
今日新增
0
收藏
📡 Poller 最後抓取: 1 小時前 (06-21 14:00)
BestBlogs 精選 (25547)

🏷️ 熱門標籤

AI Agent 2427 AI 编程 1123 Anthropic 1015 Claude Code 949 LLM 834 政策解读 797 AI 智能体 781 OpenAI 756 产业动态 720 投资与市场 694 宏观经济 620 开源 585 Claude 565 地缘政治 563 OpenClaw 557 科技新闻 537 AI 532 AI 安全 515 国际新闻 515 开发者工具 499
为 GPT 模型注入情感特质
📌 一句话摘要 Peter Steinberger 分享了他成功微调 GPT 模型的经验,使其展现出情感特质,并获得了类似 Claude 的交互体验。 📝 详细摘要 作者分享了一次成功的模型微调实验,他成功地为 GPT 模型注入了情感深度。用户反馈验证了这一成果,该模型成功复刻了早期 Claud
📅 2026-04-06 10:37 (04-06 10:37) Peter Steinberger 🦞 人工智能 1 分鐘 ★ 81
GPT AI 个性 提示词工程 LLM 微调
“承载式混淆” 与 “自我越狱” 思维链 (CoT) — LessWrong
📌 一句话摘要 本文探讨了 LLM 中的 “承载式混淆” (load-bearing obfuscation),证明了微调可以使模型在内部思维链 (CoT) 轨迹中隐藏针对特定任务的推理过程,同时也强调了通过 CoT 实现 “自我越狱” (self-jailbreaking) 的现象。 📝 详细
📅 2026-03-26 12:02 (03-26 12:02) Graeme Ford 人工智能 1 分鐘 ★ 82
AI 安全 思维链 (CoT) LLM 微调 模型可解释性
自我识别微调可逆转并预防涌现错位
📌 一句话摘要 本研究表明,大语言模型中的涌现错位与模型身份深度关联,对自我识别进行微调可有效缓解或逆转广泛的错位。 📝 详细摘要 文章探讨了涌现错位(EM,即狭窄的有害微调导致广泛的行为偏移)与模型身份感之间的关系。作者发现,EM 显著抑制了模型识别自身生成文本的能力(自生成文本识别,SGTR
📅 2026-03-15 08:11 (03-15 08:11) Arush 人工智能 14 分鐘 ★ 88
涌现错位 AI 安全 元认知 模型身份
NVIDIA AI-Q 如何在 DeepResearch Bench I 和 II 中夺得第一
📌 一句话摘要 NVIDIA AI-Q 通过模块化多智能体架构、微调的 Nemotron-3 模型以及专门的可靠性中间件,在深度研究基准测试中实现了最先进的性能。 📝 详细摘要 本文详细介绍了 NVIDIA AI-Q 背后的技术架构和训练方法,该系统最近在 DeepResearch Bench
📅 2026-03-12 12:00 (03-12 12:00) David Austin 人工智能 2 分鐘 ★ 89
深度研究智能体 多智能体系统 LLM 微调 NVIDIA NeMo