全部 未讀 (719) ★ 收藏 (0) 🤖 人工智能 (607) 📊 商业科技 (52) 💻 软件编程 (47) 🎨 产品设计 (8) 📁 AI 产品 (6)
篩選中: 🏷️ LLM 基准测试 共 5 篇 ✕ 清除篩選
720
全部文章
719
未讀
37
今日新增
0
收藏
📡 Poller 最後抓取: 1 小時前 (03-13 00:00)
BestBlogs 精選 (720)

🏷️ 熱門標籤

AI Agent 126 OpenClaw 59 AI 智能体 43 Claude Code 32 软件工程 31 Anthropic 31 AI 基础设施 29 AI 安全 25 RAG 25 开发者工具 24 软件开发 22 LLM 21 OpenAI 20 AI 编程 16 NVIDIA 15 生成式 AI 15 MCP 14 强化学习 14 开源 14 Gemini 14
英伟达发布 Nemotron 3 Super 120B-A12B 开放权重 LLM
📌 一句话摘要 Sebastian Raschka 重点介绍了英伟达新推出的 Nemotron 3 Super 120B-A12B 模型,并指出其在基准测试中表现出色,吞吐量也优于同类模型。 📝 详细摘要 这条推文讨论了英伟达 Nemotron 3 Super 120B-A12B 的发布,这是一
📅 2026-03-12 21:22 (3 小時前) Sebastian Raschka 人工智能 1 分鐘 ★ 83
Nvidia Nemotron 3 开放权重 LLM LLM 基准测试
Claude Opus 4.6 推出自适应推理与上下文压缩功能,助力长时运行智能体
📌 一句话摘要 Anthropic 发布 Claude Opus 4.6,具备自适应推理控制和上下文压缩功能,旨在优化长时运行 AI 智能体的性能与成本。 📝 详细摘要 本文详细介绍了 Claude Opus 4.6 的发布,强调了其从静态推理向动态编排的转变。核心架构更新包括细粒度的“努力程度
📅 2026-03-12 18:01 (7 小時前) Steef-Jan Wiggers 人工智能 6 分鐘 ★ 78
Claude Opus 4.6 Anthropic 智能体工作流 上下文压缩
OpenAI GPT-5.4 vs. GPT-5.4-High:Arena Expert 基准测试深度对比
📌 一句话摘要 LMArena 详细对比了 OpenAI 的 GPT-5.4 与 GPT-5.4-High 在多个专业领域的性能表现。 📝 详细摘要 本推文报告了 LMArena(原 LMSYS)针对 OpenAI GPT-5.4 模型的最新排名。GPT-5.4 和 GPT-5.4-High 均
📅 2026-03-12 05:48 (19 小時前) Arena.ai 人工智能 1 分鐘 ★ 88
GPT-5.4 OpenAI LMArena LLM 基准测试
OpenAI GPT-5.4 首次亮相 LMSYS 排行榜
📌 一句话摘要 GPT-5.4 在 LMSYS 平台的 Document Arena(并列第 2)和 Arena Expert(前 5)中均取得了顶尖排名。 📝 详细摘要 本推文报告了 OpenAI 新发布的 GPT-5.4 模型的初步基准测试结果。其亮点在于强大的文档分析能力,目前与 Clau
📅 2026-03-12 04:14 (21 小時前) Arena.ai 人工智能 3 分鐘 ★ 88
GPT-5.4 OpenAI LMSYS LLM 基准测试
NVIDIA Nemotron 3 Super 在 Expert Arena 排名第 37 位
📌 一句话摘要 LMArena 报告称,NVIDIA 的 Nemotron 3 Super 模型在多项基准测试中均跻身开源模型前 50 名。 📝 详细摘要 NVIDIA 的 Nemotron 3 Super 已正式进入 LMArena(原 LMSYS)排行榜,在 Expert Arena 开源模
📅 2026-03-12 00:07 (1 天前) Arena.ai 人工智能 3 分鐘 ★ 82
NVIDIA Nemotron 3 LMArena 开源 AI