← 回總覽

Claude Opus 4.6 疑似降智?BridgeBench 数据显示幻觉率暴增

📅 2026-04-13 06:55 Berryxia.AI 人工智能 1 分鐘 632 字 評分: 82
Claude Anthropic BridgeBench 模型评测 降智
📌 一句话摘要 根据 BridgeBench 最新基准测试,Claude Opus 4.6 的幻觉率从 83.3% 跌至 68.3%,引发社区对其「偷偷降智」的讨论。 📝 详细摘要 推文引用了 BridgeMind 发布的 BridgeBench 最新数据,指出 Claude Opus 4.6 在幻觉基准测试中的表现大幅下滑,排名从第 2 名跌至第 10 名,幻觉率增长近一倍。这一数据变动引发了用户对 Anthropic 是否对模型进行了性能缩减(降智)的广泛讨论。 📊 文章信息 AI 初评:82 来源:Berryxia.AI(@berryxia) 作者:Berryxia.AI 分类:人

Title: Welcome to BestBlogs - BestBlogs.dev

URL Source: https://www.bestblogs.dev/status/2043462982030758090

Warning: This page contains shadow DOM that are currently hidden, consider enabling shadow DOM processing.

Markdown Content: Sign in or create an account to discover the right content for you

or continue with email

Email

New users are registered automatically. The code is valid for 10 minutes.

Verification Code

First-time login will automatically create an account. By continuing, you agree to our Terms of Service and Privacy Policy.

查看原文 → 發佈: 2026-04-13 06:55:15 收錄: 2026-04-13 12:00:27

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。