全部 未讀 (21671) ★ 收藏 (0) 🤖 人工智能 (11190) 📊 商业科技 (4470) 💻 软件编程 (1687) 📁 个人成长 (1607) 📁 生活文化 (864) 📁 媒体资讯 (833) 📁 投资财经 (536) 🎨 产品设计 (409) 📁 AI 产品 (39) 📁 体育运动 (28)
篩選中: 🏷️ Arena 共 69 篇 ✕ 清除篩選
21673
全部文章
21671
未讀
35
今日新增
0
收藏
📡 Poller 最後抓取: 38 分鐘前 (06-09 00:00)
BestBlogs 精選 (21638)

🏷️ 熱門標籤

AI Agent 2168 AI 编程 991 Anthropic 981 Claude Code 917 AI 智能体 780 OpenAI 745 LLM 684 开源 574 OpenClaw 557 Claude 557 AI 517 AI 安全 490 开发者工具 432 Codex 416 软件工程 399 具身智能 338 Agent 334 个人成长 334 GitHub 321 生产力 315
Qwen 3.7 Max 在 Arena Coding Agent 排行榜位列第四
📌 一句话摘要 Qwen 3.7 Max 模型在 Arena Coding Agent 排行榜上排名第四,超越了 GLM-5.1,与 Claude Opus 4.6 水平相当。 📝 详细摘要 该推文引用 Arena 排行榜的官方公告,指出阿里通义千问的 Qwen 3.7 Max 模型在 Codi
📅 2026-05-27 11:11 (12 天前) 歸藏(guizang.ai) 人工智能 1 分鐘 ★ 78
Qwen 通义千问 Arena Coding Agent
编程权威榜单:千问 3.7 仅次于 Claude,阿里全球第二
📌 一句话摘要 阿里最新旗舰模型 Qwen3.7-Max 在权威编程榜单 Code Arena 上以 1541 分超越 GPT-5.5 等模型,仅次于 Claude 系列,排名全球第二,标志着国产大模型在编程领域跻身第一梯队。 📝 详细摘要 文章报道了阿里云最新旗舰模型 Qwen3.7-Max
📅 2026-05-26 13:32 (13 天前) 量子位的朋友们 人工智能 2 分鐘 ★ 85
Qwen3.7-Max Code Arena 阿里云 编程能力
Qwen 最新 3.7 Max 预览版空降!两代超大杯并行迭代,林俊旸走了但还在加速
📌 一句话摘要 阿里 Qwen 团队发布 Qwen3.7-Max/Plus 预览版,在 Arena 文本和视觉榜单上均取得国产模型第一的成绩,模型迭代节奏显著加速至每月一次。 📝 详细摘要 本文报道了阿里 Qwen 团队最新发布的 Qwen3.7-Max-Preview 和 Qwen3.7-Pl
📅 2026-05-19 10:46 (20 天前) 衡宇 人工智能 2 分鐘 ★ 85
Qwen3.7 阿里 大模型 Arena
百度发布文心 5.1:搜索能力登顶国内,预训练成本仅为业界 6%
📌 一句话摘要 百度发布文心大模型 5.1,采用多维弹性预训练技术,以业界 6% 的预训练成本实现基础效果领先,并登顶 LMArena 搜索榜国内第一。 📝 详细摘要 文章报道了百度在 5 月 9 日正式发布的新一代基础大模型文心 5.1。该模型的核心亮点在于其采用的「多维弹性预训练」技术,使得
📅 2026-05-09 11:11 (05-09 11:11) 量子位的朋友们 人工智能 2 分鐘 ★ 86
文心大模型 5.1 百度 大语言模型 预训练
香蕉和 GPT Image 之外的第 3 条路:华人 15 人团队造出 AI 生图黑马
📌 一句话摘要 Luma AI 以不到 15 人的团队,凭借统一推理与生成的 Uni-1.1 图像模型,在 Arena.ai 榜单上冲至全球第三,并以腰斩的价格和明确的商业落地案例,成为 OpenAI 和 Google 之外的最优解。 📝 详细摘要 本文报道了 Luma AI 正式开放 Uni-
📅 2026-05-06 17:24 (05-06 17:24) 思邈 人工智能 2 分鐘 ★ 88
Luma AI Uni-1.1 图像生成 AI 模型
文心 5.1 Preview 登顶 LMArena 文本榜,国产模型全球前十五唯一
📌 一句话摘要 文心 5.1 Preview 在 LMArena 文本榜以 1476 分排名全球第 13,超越 GPT-5.5 和 DeepSeek-V4-Pro,作者借此指出文本能力仍是模型竞争的核心地基。 📝 详细摘要 这条推文引用 LMArena 文本榜最新排名,指出百度文心 5.1 Pr
📅 2026-04-30 17:14 (04-30 17:14) Berryxia.AI 人工智能 1 分鐘 ★ 85
文心 5.1 LMArena 文本榜 国产模型
Text Arena 最新排名:Claude Opus 4.7 登顶,文心 5.1 成国产唯一前 15 模型
📌 一句话摘要 Text Arena 最新文字处理模型排名中,Claude Opus 4.7 思考模式最强,文心 5.1 Preview 位列第 13,是唯一进入前 15 的中国大模型。 📝 详细摘要 该推文对 Text Arena 最新文字处理模型排行榜进行了分析。排名显示,Claude Op
📅 2026-04-30 15:22 (04-30 15:22) 苍何 人工智能 1 分鐘 ★ 82
Text Arena Claude Opus 4.7 文心 5.1 大模型排名
OpenAI GPT-Image-2 登顶文生图竞技场排行榜
📌 一句话摘要 GPT-Image-2 在 Image Arena 排行榜中以 1512 分大幅领先 Google 等竞争对手,展现出文生图领域的加速突破。 📝 详细摘要 根据最新的文生图竞技场(Image Arena)趋势数据,OpenAI 的 GPT-Image-2 模型以 1512 分的成
📅 2026-04-22 16:06 (04-22 16:06) AI Will 人工智能 1 分鐘 ★ 86
GPT-Image-2 OpenAI Image Arena 文生图
Image Arena 细分类别排行榜细节
📌 一句话摘要 展示 Image Arena 文生图竞技场在不同细分维度的排行榜详细数据。 📝 详细摘要 作为 Thread 的补充,本推文通过图片展示了 Image Arena 的细分类别排行榜,包括单图编辑、多图编辑等维度的具体表现,为评估 GPT-Image-2 的全面领先地位提供数据支撑
📅 2026-04-22 16:06 (04-22 16:06) AI Will 人工智能 1 分鐘 ★ 78
Image Arena 排行榜 数据细节
GPT-Image-2 登顶 Image Arena 榜单:强大的语言理解与出图能力
📌 一句话摘要 仓何分享了 OpenAI 的 GPT-Image-2 在 Image Arena 榜单全面登顶的消息,并称赞其极强的语言理解与精准出图能力。 📝 详细摘要 该推文引用了 LMSYS Image Arena 的官方数据,指出 OpenAI 的新模型 GPT-Image-2 在文生图
📅 2026-04-22 08:02 (04-22 08:02) 苍何 人工智能 1 分鐘 ★ 86
GPT-Image-2 OpenAI Image Arena 文生图
GPT-Image-2 霸榜 LMSYS Image Arena 第一
📌 一句话摘要 OpenAI 的 GPT-Image-2 模型在 LMSYS 图像竞技场中以显著优势夺得各项榜单冠军。 📝 详细摘要 推文转发了 LMSYS Arena 的官方战报,确认 OpenAI 的新模型 GPT-Image-2 在图像生成领域实现了「大满贯」。该模型在文生图(Text-t
📅 2026-04-22 07:04 (04-22 07:04) Berryxia.AI 人工智能 1 分鐘 ★ 84
GPT-Image-2 OpenAI LMSYS Image Arena
Meta Muse Spark 首次亮相,跻身 LMSYS Arena 顶尖模型行列
📌 一句话摘要 Meta 推出的全新 Muse Spark 模型在 LMSYS Arena 基准测试中表现卓越,文本排名并列第 3,多模态视觉排名并列第 2。 📝 详细摘要 Meta 凭借 Muse Spark 的发布正式回归 AI 顶尖模型阵营。根据最新的 LMSYS Arena 基准测试结果
📅 2026-04-11 06:09 (04-11 06:09) Arena.ai 人工智能 1 分鐘 ★ 88
Meta Muse Spark LMSYS Arena LLM 基准测试
GLM-5.1 登顶 Code Arena 开源模型榜单
📌 一句话摘要 GLM-5.1 夺得 Code Arena 开源模型排名第一,在编程任务中超越了 Claude Sonnet 4.6 和 GPT-5.4 High 等主流闭源模型。 📝 详细摘要 这条推文标志着开源 AI 的一个重要里程碑:GLM-5.1 已登顶 Code Arena 开源模型排
📅 2026-04-11 00:40 (04-11 00:40) Arena.ai 人工智能 1 分鐘 ★ 88
GLM-5.1 Code Arena 开源 AI LLM 基准测试
在 Code Arena 探索 Agent 编码能力对比
📌 一句话摘要 提供了 Code Arena 平台的后续链接,用于对比 AI 模型在多步推理和工具调用编程任务中的表现。 📝 详细摘要 作为 GLM-5.1 发布消息的补充,这条推文提供了 Code Arena 的直接链接。它鼓励用户探索不同 AI 模型在“Agent(智能体)”编码任务中的表现
📅 2026-04-11 00:40 (04-11 00:40) Arena.ai 人工智能 1 分鐘 ★ 79
Code Arena Agent 编码 AI 基准测试 工具调用
GLM-5.1 以 1530 分稳居开源模型榜首
📌 一句话摘要 GLM-5.1 以 1530 的高分巩固了其在 Code Arena 中顶尖开源模型的地位,足以媲美顶级闭源模型。 📝 详细摘要 该推文进一步介绍了 GLM-5.1 的表现,指出其 1530 的评分距离绝对榜首仅差 20 分左右。它强调开源模型现在已在“前沿”水平具备真正的竞争力
📅 2026-04-11 00:01 (04-11 00:01) Arena.ai 人工智能 1 分鐘 ★ 84
GLM-5.1 开源 AI Code Arena 前沿模型
阿里视频生成大模型 Wan2.7 登顶 DesignArena 榜单
📌 一句话摘要 阿里巴巴 Wan2.7 视频生成大模型在 DesignArena 视频编辑榜单登顶,Elo 评分大幅领先竞品。 📝 详细摘要 阿里巴巴最新发布的 Wan2.7-Video 视频生成系列模型在 DesignArena 的 Video to Video(视频编辑)功能评测中,以 13
📅 2026-04-10 20:07 (04-10 20:07) 量子位的朋友们 人工智能 1 分鐘 ★ 86
Wan2.7 视频生成 阿里巴巴 DesignArena
Grok-4.2 在法律与政府领域表现卓越
📌 一句话摘要 Grok-4.2 在 Chatbot Arena 法律领域排名第一,超越 Opus 4.6 和 Gemini 3.1 Pro。 📝 详细摘要 推文简要评价了 Grok-4.2 的搜索和整理能力,并引用数据指出其在 Chatbot Arena 的「法律与政府」分类中位列榜首。其表现
📅 2026-04-10 06:40 (04-10 06:40) Berryxia.AI 人工智能 1 分鐘 ★ 80
Grok-4.2 Chatbot Arena 法律 AI 模型评测
访问 Video Arena 排行榜详情
📌 一句话摘要 提供完整 Video Arena 排行榜的链接,方便用户自定义查看 AI 模型排名。 📝 详细摘要 这条推文提供了访问 arena.ai 上 Video Arena 排行榜的直接链接,允许用户探索详细排名、筛选结果,并自定义查看最新的文生视频模型性能表现。 📊 文章信息 AI
📅 2026-04-09 03:59 (04-09 03:59) Arena.ai 人工智能 1 分鐘 ★ 78
AI 排行榜 Video Arena 模型评估
Dreamina Seedance 2.0 登顶 Video Arena 排行榜
📌 一句话摘要 字节跳动旗下的 Dreamina Seedance 2.0 在 Video Arena 的文生视频和图生视频基准测试中均取得第一名。 📝 详细摘要 这条推文宣布了 AI 视频生成领域的重大格局变动。字节跳动的 Dreamina Seedance 2.0(720p 版本)夺得 Vi
📅 2026-04-08 11:04 (04-08 11:04) Arena.ai 人工智能 3 分鐘 ★ 84
Dreamina Seedance 2.0 Video Arena 字节跳动
GLM-5.1 现已在 Code Arena 上线,支持智能体任务
📌 一句话摘要 GLM-5.1 现已开放 Code Arena 测试,专门针对智能体 Web 开发和工具使用任务。 📝 详细摘要 LMSYS Arena 邀请用户在其专门的 Code Arena(编程竞技场)中测试 GLM-5.1。该环境专注于需要模型自主使用工具的智能体(Agentic)Web
📅 2026-04-08 06:15 (04-08 06:15) Arena.ai 人工智能 1 分鐘 ★ 81
GLM-5.1 Code Arena AI 智能体 Web 开发