全部 未讀 (11783) ★ 收藏 (0) 🤖 人工智能 (7568) 📊 商业科技 (1784) 💻 软件编程 (1196) 📁 个人成长 (735) 🎨 产品设计 (208) 📁 生活文化 (108) 📁 投资财经 (71) 📁 媒体资讯 (69) 📁 AI 产品 (39) 📁 AI (5)
篩選中: 🏷️ 校准 共 4 篇 ✕ 清除篩選
11785
全部文章
11783
未讀
102
今日新增
0
收藏
📡 Poller 最後抓取: 1 小時前 (04-16 12:00)
BestBlogs 精選 (11766)

🏷️ 熱門標籤

AI Agent 1319 AI 智能体 732 Claude Code 643 Anthropic 621 LLM 563 OpenClaw 498 AI 编程 497 开源 438 AI 396 AI 安全 395 Claude 381 OpenAI 362 软件工程 354 开发者工具 341 生产力 308 GitHub 249 自动化 238 AI 基础设施 227 AI 开发 224 MCP 223
我制作了一个 10 题测试。上线 1 天,1934 人参与。这是我的心得 — LessWrong
📌 一句话摘要 一位开发者分享了利用病毒式传播的校准测试作为营销漏斗的案例研究,揭示了用户决策模式的洞察,以及将休闲工具用户转化为平台忠实用户的挑战。 📝 详细摘要 作者制作了一个 10 题校准测试,旨在为新的决策平台引流,并将其发布在 Hacker News 上。24 小时内,近 2000 人
📅 2026-04-10 10:49 (6 天前) Convexly 产品设计 1 分鐘 ★ 85
增长黑客 产品营销 转化率 决策
关键应用中 LLM 置信度的黑盒评估流程 — LessWrong
📌 一句话摘要 本文提出了一种实用的黑盒方法,通过结合训练数据密度估计、重复查询的稳定性测试以及辅助验证问题,来评估关键应用中 LLM 的可靠性并校准模型置信度。 📝 详细摘要 作者提出了一种系统性的黑盒方法,用于评估高风险工程应用中 LLM 的置信度,旨在解决模型过度自信这一关键问题。通过分析
📅 2026-04-06 21:47 (9 天前) Jadair 人工智能 1 分鐘 ★ 89
LLM 可靠性 置信度校准 AI 工程
浙大团队破解多模态模型「盲目自信」:先校准置信度,再分配算力丨 CVPR’26
📌 一句话摘要 浙江大学等团队提出 CA-TTS 框架,通过置信度驱动的强化学习校准多模态模型的自我评估能力,并将校准后的置信度转化为推理资源分配信号,在四大视觉推理基准上全面达到 SOTA。 📝 详细摘要 本文介绍了浙江大学联合阿里巴巴、香港城市大学、密歇根大学研究团队在 CVPR 2026
📅 2026-03-22 15:17 (24 天前) 听雨 人工智能 12 分鐘 ★ 91
多模态大模型 置信度校准 CVPR 2026 CA-TTS
AI 模型的分布引导置信度校准
📌 一句话摘要 一篇提出通过分布引导方法来改进机器学习模型置信度校准的论文。 📝 详细摘要 研究《相信你的模型》(Believe Your Model)探讨了模型过度自信或自信不足的问题。它提出了一种“分布引导置信度校准”技术,以确保模型的预测概率能更好地反映实际可能性,这对于可靠的 AI 部署
📅 2026-03-10 23:33 (03-10 23:33) AK 人工智能 1 分鐘 ★ 78
置信度校准 模型可靠性 机器学习 概率分布