阿里发布 Qwen3.7-Plus 多模态大模型,实现视觉理解、编程、工具调用与自主迭代的统一智能体工作流,可一键复刻桌面软件等复杂任务。
📝 详细摘要
6 月 2 日,阿里巴巴发布千问 3.7 系列多模态大模型 Qwen3.7-Plus。该模型在文本和视觉能力上大幅提升,于全球视觉大模型榜单 Vision Arena 中跻身全球前五、中国第一。其核心突破在于实现了多模态混合智能体,将「看、想、写、做、验」整合进统一工作流,能理解图片和视频,进行深度推理、自我编程、调用工具、验证测试并自主迭代。典型应用包括一键复刻手机 APP 和桌面端专业软件等复杂长程任务。目前模型已上线阿里云百炼,提供 API 服务。
💡 主要观点
- Qwen3.7-Plus 实现多模态混合智能体新突破。 模型将视觉理解、深度推理、自我编程、工具调用和自主验证整合为统一工作流,能完成一键复刻桌面软件等复杂长程任务。
💬 文章金句
- Qwen3.7-Plus 实现了多模态混合智能体的新突破,不仅能看懂图片和视频,还能深度推理、自我编程、调用工具、验证测试并自主迭代。
- 将'看、想、写、做、验'整合进统一的智能体工作流,轻松完成一键复刻手机 APP 应用、桌面端专业软件等复杂长程任务。
📊 文章信息
AI 初评:85
来源:量子位
作者:量子位的朋友们
分类:人工智能
语言:中文
阅读时间:2 分钟
字数:466
标签: Qwen3.7-Plus, 多模态大模型, 智能体, 阿里云, 视觉理解