SuperPortia Reading
總覽
文章
簡報
🔍 搜尋
全部
未讀 (21671)
★ 收藏 (0)
🤖 人工智能 (11190)
📊 商业科技 (4470)
💻 软件编程 (1687)
📁 个人成长 (1607)
📁 生活文化 (864)
📁 媒体资讯 (833)
📁 投资财经 (536)
🎨 产品设计 (409)
📁 AI 产品 (39)
📁 体育运动 (28)
篩選中:
🏷️ 置信度校准
共 4 篇
✕ 清除篩選
21673
全部文章
21671
未讀
35
今日新增
0
收藏
📡 Poller
最後抓取:
32 分鐘前
(06-09 00:00)
BestBlogs 精選 (21638)
🏷️ 熱門標籤
AI Agent
2168
AI 编程
991
Anthropic
981
Claude Code
917
AI 智能体
780
OpenAI
745
LLM
684
开源
574
OpenClaw
557
Claude
557
AI
517
AI 安全
490
开发者工具
432
Codex
416
软件工程
399
具身智能
338
Agent
334
个人成长
334
GitHub
321
生产力
315
●
ACL 2026|多模态大模型是“看错”还是“想错”?浙大 VL-Calibration 让模型学会校准自信
📌 一句话摘要 浙江大学团队提出 VL-Calibration 框架,通过强化学习将多模态大模型的置信度解耦为视觉置信度和推理置信度,有效解决了模型“盲目自信”的问题,并被 ACL 2026 接收。 📝 详细摘要 本文介绍了浙江大学研究团队提出的 VL-Calibration 框架,旨在解决大型
📅 2026-05-20 00:00
(20 天前)
青稞AI
人工智能
2 分鐘
★ 86
多模态大模型
置信度校准
强化学习
视觉语言模型
●
关键应用中 LLM 置信度的黑盒评估流程 — LessWrong
📌 一句话摘要 本文提出了一种实用的黑盒方法,通过结合训练数据密度估计、重复查询的稳定性测试以及辅助验证问题,来评估关键应用中 LLM 的可靠性并校准模型置信度。 📝 详细摘要 作者提出了一种系统性的黑盒方法,用于评估高风险工程应用中 LLM 的置信度,旨在解决模型过度自信这一关键问题。通过分析
📅 2026-04-06 21:47
(04-06 21:47)
Jadair
人工智能
1 分鐘
★ 89
LLM
可靠性
置信度校准
AI 工程
●
浙大团队破解多模态模型「盲目自信」:先校准置信度,再分配算力丨 CVPR’26
📌 一句话摘要 浙江大学等团队提出 CA-TTS 框架,通过置信度驱动的强化学习校准多模态模型的自我评估能力,并将校准后的置信度转化为推理资源分配信号,在四大视觉推理基准上全面达到 SOTA。 📝 详细摘要 本文介绍了浙江大学联合阿里巴巴、香港城市大学、密歇根大学研究团队在 CVPR 2026
📅 2026-03-22 15:17
(03-22 15:17)
听雨
人工智能
12 分鐘
★ 91
多模态大模型
置信度校准
CVPR 2026
CA-TTS
●
AI 模型的分布引导置信度校准
📌 一句话摘要 一篇提出通过分布引导方法来改进机器学习模型置信度校准的论文。 📝 详细摘要 研究《相信你的模型》(Believe Your Model)探讨了模型过度自信或自信不足的问题。它提出了一种“分布引导置信度校准”技术,以确保模型的预测概率能更好地反映实际可能性,这对于可靠的 AI 部署
📅 2026-03-10 23:33
(03-10 23:33)
AK
人工智能
1 分鐘
★ 78
置信度校准
模型可靠性
机器学习
概率分布