SuperPortia Reading
總覽
文章
簡報
🔍 搜尋
全部
未讀 (25599)
★ 收藏 (0)
🤖 人工智能 (11644)
📊 商业科技 (5075)
📁 媒体资讯 (2027)
💻 软件编程 (1793)
📁 个人成长 (1665)
📁 生活文化 (1388)
📁 投资财经 (1236)
🎨 产品设计 (453)
📁 体育运动 (270)
📁 AI 产品 (39)
篩選中:
🏷️ LLM 微调
共 4 篇
✕ 清除篩選
25601
全部文章
25599
未讀
177
今日新增
0
收藏
📡 Poller
最後抓取:
1 小時前
(06-21 14:00)
BestBlogs 精選 (25547)
🏷️ 熱門標籤
AI Agent
2427
AI 编程
1123
Anthropic
1015
Claude Code
949
LLM
834
政策解读
797
AI 智能体
781
OpenAI
756
产业动态
720
投资与市场
694
宏观经济
620
开源
585
Claude
565
地缘政治
563
OpenClaw
557
科技新闻
537
AI
532
AI 安全
515
国际新闻
515
开发者工具
499
●
为 GPT 模型注入情感特质
📌 一句话摘要 Peter Steinberger 分享了他成功微调 GPT 模型的经验,使其展现出情感特质,并获得了类似 Claude 的交互体验。 📝 详细摘要 作者分享了一次成功的模型微调实验,他成功地为 GPT 模型注入了情感深度。用户反馈验证了这一成果,该模型成功复刻了早期 Claud
📅 2026-04-06 10:37
(04-06 10:37)
Peter Steinberger 🦞
人工智能
1 分鐘
★ 81
GPT
AI 个性
提示词工程
LLM 微调
●
“承载式混淆” 与 “自我越狱” 思维链 (CoT) — LessWrong
📌 一句话摘要 本文探讨了 LLM 中的 “承载式混淆” (load-bearing obfuscation),证明了微调可以使模型在内部思维链 (CoT) 轨迹中隐藏针对特定任务的推理过程,同时也强调了通过 CoT 实现 “自我越狱” (self-jailbreaking) 的现象。 📝 详细
📅 2026-03-26 12:02
(03-26 12:02)
Graeme Ford
人工智能
1 分鐘
★ 82
AI 安全
思维链 (CoT)
LLM 微调
模型可解释性
●
自我识别微调可逆转并预防涌现错位
📌 一句话摘要 本研究表明,大语言模型中的涌现错位与模型身份深度关联,对自我识别进行微调可有效缓解或逆转广泛的错位。 📝 详细摘要 文章探讨了涌现错位(EM,即狭窄的有害微调导致广泛的行为偏移)与模型身份感之间的关系。作者发现,EM 显著抑制了模型识别自身生成文本的能力(自生成文本识别,SGTR
📅 2026-03-15 08:11
(03-15 08:11)
Arush
人工智能
14 分鐘
★ 88
涌现错位
AI 安全
元认知
模型身份
●
NVIDIA AI-Q 如何在 DeepResearch Bench I 和 II 中夺得第一
📌 一句话摘要 NVIDIA AI-Q 通过模块化多智能体架构、微调的 Nemotron-3 模型以及专门的可靠性中间件,在深度研究基准测试中实现了最先进的性能。 📝 详细摘要 本文详细介绍了 NVIDIA AI-Q 背后的技术架构和训练方法,该系统最近在 DeepResearch Bench
📅 2026-03-12 12:00
(03-12 12:00)
David Austin
人工智能
2 分鐘
★ 89
深度研究智能体
多智能体系统
LLM 微调
NVIDIA NeMo