全部 未讀 (12221) ★ 收藏 (0) 🤖 人工智能 (7782) 📊 商业科技 (1917) 💻 软件编程 (1217) 📁 个人成长 (761) 🎨 产品设计 (214) 📁 生活文化 (130) 📁 媒体资讯 (80) 📁 投资财经 (76) 📁 AI 产品 (39) 📁 AI (5)
篩選中: 🏷️ LMSYS Arena 共 4 篇 ✕ 清除篩選
12223
全部文章
12221
未讀
93
今日新增
0
收藏
📡 Poller 最後抓取: 1 小時前 (04-18 18:00)
BestBlogs 精選 (12202)

🏷️ 熱門標籤

AI Agent 1369 AI 智能体 737 Claude Code 656 Anthropic 650 LLM 564 AI 编程 536 OpenClaw 501 开源 444 AI 安全 409 Claude 400 AI 398 OpenAI 371 软件工程 359 开发者工具 348 生产力 308 GitHub 254 自动化 241 AI 基础设施 229 AI 开发 226 MCP 225
Meta Muse Spark 首次亮相,跻身 LMSYS Arena 顶尖模型行列
📌 一句话摘要 Meta 推出的全新 Muse Spark 模型在 LMSYS Arena 基准测试中表现卓越,文本排名并列第 3,多模态视觉排名并列第 2。 📝 详细摘要 Meta 凭借 Muse Spark 的发布正式回归 AI 顶尖模型阵营。根据最新的 LMSYS Arena 基准测试结果
📅 2026-04-11 06:09 (7 天前) Arena.ai 人工智能 1 分鐘 ★ 88
Meta Muse Spark LMSYS Arena LLM 基准测试
在 LMSYS Arena 上发现的新图像模型
📌 一句话摘要 Justine Moore 重点介绍了在 LMSYS Arena 上出现的三款新图像生成模型——maskingtape、packingtape 和 gaffertape,并指出它们具备强大的文本渲染和“世界知识”能力。 📝 详细摘要 这条推文介绍了在 LMSYS Arena 上发
📅 2026-04-04 11:42 (14 天前) Justine Moore 人工智能 1 分鐘 ★ 82
LMSYS Arena 图像生成 AI 模型 生成式 AI
Grok 4.20 Beta Reasoning 首次亮相 LMSYS 排行榜
📌 一句话摘要 xAI 的 Grok 4.20 Beta Reasoning 在 LMSYS Arena 榜单中取得显著成绩,位列文本榜第 7 名和代码榜第 28 名。 📝 详细摘要 LMSYS Arena 公布了 xAI 全新推理模型 Grok 4.20 Beta Reasoning 的基准测
📅 2026-03-17 05:10 (03-17 05:10) Arena.ai 人工智能 1 分鐘 ★ 88
Grok 4.20 xAI LMSYS Arena 大模型基准测试
LMSYS Arena 排行榜新增价格和上下文数据
📌 一句话摘要 Arena 排行榜现已加入模型定价(每 100 万 token)和最大上下文窗口大小,以帮助用户比较大型语言模型(LLM)。 📝 详细摘要 lmarena.ai(前身为 LMSYS)已更新其基准测试排行榜,纳入了关键的经济和技术指标:每百万 token 的输入/输出成本以及最大上
📅 2026-03-14 06:08 (03-14 06:08) Arena.ai 人工智能 2 分鐘 ★ 84
大型语言模型基准测试 LMSYS Arena 模型定价 上下文窗口