全部 未讀 (802) ★ 收藏 (0) 🤖 人工智能 (681) 📊 商业科技 (59) 💻 软件编程 (49) 🎨 产品设计 (8) 📁 AI 产品 (6)
篩選中: 🏷️ LoRA 共 2 篇 ✕ 清除篩選
803
全部文章
802
未讀
120
今日新增
0
收藏
📡 Poller 最後抓取: 59 分鐘前 (03-13 04:00)
BestBlogs 精選 (803)

🏷️ 熱門標籤

AI Agent 128 OpenClaw 62 AI 智能体 58 Anthropic 37 Claude Code 32 AI 基础设施 32 软件工程 32 开发者工具 29 AI 安全 26 RAG 26 软件开发 26 OpenAI 24 LLM 22 AI 编程 18 Gemini 18 强化学习 17 开源 17 Claude 16 生成式 AI 16 CLI 16
Qwen3.5 × Twinkle 低成本模型训练最佳实践
📌 一句话摘要 本文介绍了通义实验室开源的 Twinkle 大模型训练框架,通过 Qwen3.5 实战展示了其在低成本 LoRA 微调、强化学习(GRPO)及云端训推分离场景下的高效应用。 📝 详细摘要 文章详细阐述了通义实验室最新开源的 Twinkle 框架,旨在解决大模型分布式训练中显存占用
📅 2026-03-12 17:20 (11 小時前) 通义大模型 人工智能 2 分鐘 ★ 85
Twinkle Qwen3.5 大模型训练 LoRA
ParamMem:通过少量样本让 AI 学会反思模式
📌 一句话摘要 介绍 ParamMem 研究,通过 500 个样本的 LoRA 微调显著提升 AI 的反思与自我改进能力。 📝 详细摘要 针对 AI 易陷入循环错误的问题,推文介绍了 ParamMem 研究。该方法不依赖复杂的提示词或外部搜索,而是通过仅 500 个样本的 LoRA 微调,让模型
📅 2026-03-12 16:28 (12 小時前) 向阳乔木 人工智能 1 分鐘 ★ 86
ParamMem LoRA 模型反思 微调训练