Artificial Analysis 最新全球大模型榜单发布,阿里 Qwen3.7-Max 以 56.6 分位列全球第五、国产第一,性能逼近 GPT、Claude、Gemini 最强模型。
📝 详细摘要
文章报道了第三方评测机构 Artificial Analysis 公布的最新全球大模型榜单。阿里云新发布的旗舰模型 Qwen3.7-Max 以 56.6 分的成绩,超越了 Kimi-K2.6、DeepSeek-v4-Pro-Max、GLM5.1 等所有国产模型,位列全球第五,成为国产模型性能冠军。该模型较上代旗舰 Qwen3.6-Max-Preview 提升了 4.8 分,性能已逼近 GPT-5.4、Gemini3.1 Pro Preview 和 Claude-Opus4.7 等国际顶尖模型。文章还介绍了 Qwen3.7-Max 专为 Agent 智能体设计,在编程、智能体和推理等核心能力上实现大幅突破,能够与多种 Agent 框架协同,独立完成复杂的长时间任务。
💡 主要观点
- Qwen3.7-Max 在 Artificial Analysis 榜单上位列全球第五、国产第一。 该模型以 56.6 分超越所有其他国产模型,性能逼近 GPT、Claude、Gemini 等国际顶尖模型,标志着国产大模型在综合能力上的重要突破。
💬 文章金句
- Qwen3.7-Max 得分 56.6 分,超过了 Kimi-K2.6、DeepSeek-v4-Pro-Max、GLM5.1 等所有国产模型,性能接近 GPT、Claude、Gemini 的最强模型,位列全球第五、国产第一。
- 千问 3.7 可与 Claude Code、OpenClaw、Hermes Agent、Qwen Code 等各类 Agent 框架完美协同,通过自主编程和 Agent 工具调用,可独立完成 35 小时、超 1000 次工具调用的复杂长程任务。
📊 文章信息
AI 初评:85
来源:量子位
作者:量子位的朋友们
分类:人工智能
语言:中文
阅读时间:3 分钟
字数:732
标签: Qwen3.7-Max, Artificial Analysis, 大模型评测, 国产模型, 阿里千问