← 回總覽

Artificial Analysis 放榜:千问 3.7 问鼎国产模型冠军,全球前五

📅 2026-05-21 17:16 量子位的朋友们 人工智能 2 分鐘 1497 字 評分: 85
Qwen3.7-Max Artificial Analysis 大模型评测 国产模型 阿里千问
📌 一句话摘要 Artificial Analysis 最新全球大模型榜单发布,阿里 Qwen3.7-Max 以 56.6 分位列全球第五、国产第一,性能逼近 GPT、Claude、Gemini 最强模型。 📝 详细摘要 文章报道了第三方评测机构 Artificial Analysis 公布的最新全球大模型榜单。阿里云新发布的旗舰模型 Qwen3.7-Max 以 56.6 分的成绩,超越了 Kimi-K2.6、DeepSeek-v4-Pro-Max、GLM5.1 等所有国产模型,位列全球第五,成为国产模型性能冠军。该模型较上代旗舰 Qwen3.6-Max-Preview 提升了 4.8 分

📌 一句话摘要

Artificial Analysis 最新全球大模型榜单发布,阿里 Qwen3.7-Max 以 56.6 分位列全球第五、国产第一,性能逼近 GPT、Claude、Gemini 最强模型。

📝 详细摘要

文章报道了第三方评测机构 Artificial Analysis 公布的最新全球大模型榜单。阿里云新发布的旗舰模型 Qwen3.7-Max 以 56.6 分的成绩,超越了 Kimi-K2.6、DeepSeek-v4-Pro-Max、GLM5.1 等所有国产模型,位列全球第五,成为国产模型性能冠军。该模型较上代旗舰 Qwen3.6-Max-Preview 提升了 4.8 分,性能已逼近 GPT-5.4、Gemini3.1 Pro Preview 和 Claude-Opus4.7 等国际顶尖模型。文章还介绍了 Qwen3.7-Max 专为 Agent 智能体设计,在编程、智能体和推理等核心能力上实现大幅突破,能够与多种 Agent 框架协同,独立完成复杂的长时间任务。

💡 主要观点

- Qwen3.7-Max 在 Artificial Analysis 榜单上位列全球第五、国产第一。 该模型以 56.6 分超越所有其他国产模型,性能逼近 GPT、Claude、Gemini 等国际顶尖模型,标志着国产大模型在综合能力上的重要突破。

Qwen3.7-Max 专为 Agent 智能体场景设计,核心能力大幅提升。 模型在编程、智能体和推理等能力上取得突破,能够与 Claude Code、Qwen Code 等 Agent 框架协同,独立完成包含超 1000 次工具调用的复杂长程任务,具备企业级应用潜力。
Artificial Analysis 榜单被公认为最具影响力的第三方评测之一。 该平台对全球大模型进行多维度基准测试和性能评估,其综合排名具有较高权威性,Qwen3.7-Max 的排名变化反映了国产模型与国际顶尖水平的差距正在缩小。

💬 文章金句

- Qwen3.7-Max 得分 56.6 分,超过了 Kimi-K2.6、DeepSeek-v4-Pro-Max、GLM5.1 等所有国产模型,性能接近 GPT、Claude、Gemini 的最强模型,位列全球第五、国产第一。

  • 千问 3.7 可与 Claude Code、OpenClaw、Hermes Agent、Qwen Code 等各类 Agent 框架完美协同,通过自主编程和 Agent 工具调用,可独立完成 35 小时、超 1000 次工具调用的复杂长程任务。

📊 文章信息

AI 初评:85

来源:量子位

作者:量子位的朋友们

分类:人工智能

语言:中文

阅读时间:3 分钟

字数:732

标签: Qwen3.7-Max, Artificial Analysis, 大模型评测, 国产模型, 阿里千问

阅读完整文章

查看原文 → 發佈: 2026-05-21 17:16:12 收錄: 2026-05-21 22:00:45

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。