Qwen 发布了 Qwen3.5-Omni,这是一款新一代模型,具备原生文本、图像、音频和视频理解能力,并支持“视听氛围编程”和实时交互功能。
📝 详细摘要
Qwen 宣布发布 Qwen3.5-Omni,这是其模型阵容的重大进步。该模型专为原生多模态理解(文本、图像、音频和视频)而设计,引入了“视听氛围编程”功能,允许用户通过摄像头输入生成功能性网站或游戏。该模型系列包括 Plus、Flash 和 Light 版本,在音频方面表现出 SOTA 水准,并提供广泛的语言支持。
📊 文章信息
AI 评分:94
来源:Qwen(@Alibaba_Qwen)
作者:Qwen
分类:人工智能
语言:英文
阅读时间:7 分钟
字数:1505
标签: Qwen, Qwen3.5-Omni, AGI, 全模态, AI 模型