全部 未讀 (21671) ★ 收藏 (0) 🤖 人工智能 (11190) 📊 商业科技 (4470) 💻 软件编程 (1687) 📁 个人成长 (1607) 📁 生活文化 (864) 📁 媒体资讯 (833) 📁 投资财经 (536) 🎨 产品设计 (409) 📁 AI 产品 (39) 📁 体育运动 (28)
篩選中: 🏷️ 置信度校准 共 4 篇 ✕ 清除篩選
21673
全部文章
21671
未讀
35
今日新增
0
收藏
📡 Poller 最後抓取: 32 分鐘前 (06-09 00:00)
BestBlogs 精選 (21638)

🏷️ 熱門標籤

AI Agent 2168 AI 编程 991 Anthropic 981 Claude Code 917 AI 智能体 780 OpenAI 745 LLM 684 开源 574 OpenClaw 557 Claude 557 AI 517 AI 安全 490 开发者工具 432 Codex 416 软件工程 399 具身智能 338 Agent 334 个人成长 334 GitHub 321 生产力 315
ACL 2026|多模态大模型是“看错”还是“想错”?浙大 VL-Calibration 让模型学会校准自信
📌 一句话摘要 浙江大学团队提出 VL-Calibration 框架,通过强化学习将多模态大模型的置信度解耦为视觉置信度和推理置信度,有效解决了模型“盲目自信”的问题,并被 ACL 2026 接收。 📝 详细摘要 本文介绍了浙江大学研究团队提出的 VL-Calibration 框架,旨在解决大型
📅 2026-05-20 00:00 (20 天前) 青稞AI 人工智能 2 分鐘 ★ 86
多模态大模型 置信度校准 强化学习 视觉语言模型
关键应用中 LLM 置信度的黑盒评估流程 — LessWrong
📌 一句话摘要 本文提出了一种实用的黑盒方法,通过结合训练数据密度估计、重复查询的稳定性测试以及辅助验证问题,来评估关键应用中 LLM 的可靠性并校准模型置信度。 📝 详细摘要 作者提出了一种系统性的黑盒方法,用于评估高风险工程应用中 LLM 的置信度,旨在解决模型过度自信这一关键问题。通过分析
📅 2026-04-06 21:47 (04-06 21:47) Jadair 人工智能 1 分鐘 ★ 89
LLM 可靠性 置信度校准 AI 工程
浙大团队破解多模态模型「盲目自信」:先校准置信度,再分配算力丨 CVPR’26
📌 一句话摘要 浙江大学等团队提出 CA-TTS 框架,通过置信度驱动的强化学习校准多模态模型的自我评估能力,并将校准后的置信度转化为推理资源分配信号,在四大视觉推理基准上全面达到 SOTA。 📝 详细摘要 本文介绍了浙江大学联合阿里巴巴、香港城市大学、密歇根大学研究团队在 CVPR 2026
📅 2026-03-22 15:17 (03-22 15:17) 听雨 人工智能 12 分鐘 ★ 91
多模态大模型 置信度校准 CVPR 2026 CA-TTS
AI 模型的分布引导置信度校准
📌 一句话摘要 一篇提出通过分布引导方法来改进机器学习模型置信度校准的论文。 📝 详细摘要 研究《相信你的模型》(Believe Your Model)探讨了模型过度自信或自信不足的问题。它提出了一种“分布引导置信度校准”技术,以确保模型的预测概率能更好地反映实际可能性,这对于可靠的 AI 部署
📅 2026-03-10 23:33 (03-10 23:33) AK 人工智能 1 分鐘 ★ 78
置信度校准 模型可靠性 机器学习 概率分布