SuperPortia Reading
總覽
文章
簡報
🔍 搜尋
全部
未讀 (820)
★ 收藏 (0)
🤖 人工智能 (698)
📊 商业科技 (60)
💻 软件编程 (49)
🎨 产品设计 (8)
📁 AI 产品 (6)
篩選中:
🏷️ GRPO
共 2 篇
✕ 清除篩選
821
全部文章
820
未讀
138
今日新增
0
收藏
📡 Poller
最後抓取:
1 小時前
(03-13 06:00)
BestBlogs 精選 (821)
🏷️ 熱門標籤
AI Agent
129
OpenClaw
62
AI 智能体
61
Anthropic
41
AI 基础设施
35
Claude Code
32
软件工程
32
开发者工具
30
OpenAI
27
AI 安全
27
RAG
26
软件开发
26
LLM
22
AI 编程
18
Claude
18
开源
18
Gemini
18
强化学习
17
MCP
16
生成式 AI
16
●
Qwen3.5 × Twinkle 低成本模型训练最佳实践
📌 一句话摘要 本文介绍了通义实验室开源的 Twinkle 大模型训练框架,通过 Qwen3.5 实战展示了其在低成本 LoRA 微调、强化学习(GRPO)及云端训推分离场景下的高效应用。 📝 详细摘要 文章详细阐述了通义实验室最新开源的 Twinkle 框架,旨在解决大模型分布式训练中显存占用
📅 2026-03-12 17:20
(14 小時前)
通义大模型
人工智能
2 分鐘
★ 85
Twinkle
Qwen3.5
大模型训练
LoRA
●
循环一致性激活预言机 — LessWrong
📌 一句话摘要 本研究探索了利用循环一致性训练模型将 LLM 激活转换为自然语言的方法,发现虽然该方法能生成合理的文本,但往往优先考虑上下文重建,而非忠实描述内部状态。 📝 详细摘要 本文研究了一种名为“循环一致性激活预言机”(Cycle-Consistent Activation Oracle
📅 2026-03-12 10:58
(20 小時前)
slavachalnev
人工智能
12 分鐘
★ 84
机械可解释性
激活预言机
循环一致性
LLM 内部机制