DeepSeek 灰度上线识图模式,支持多模态理解,本文通过识物、定位、视觉陷阱、手相等测试展示了其能力。
📝 详细摘要
本文报道了 DeepSeek 多模态识图模式灰度上线的消息。作者被灰度选中后,进行了多项测试:识别兔子品种、根据建筑风格和路灯字样定位灵隐寺并给出经纬度、识别视觉陷阱图片、通过无文字照片推断拍摄地点(精确到北京昌平区)。文章还测试了手相分析功能,指出 DeepSeek 存在左右手判断错误的问题。文章认为,DeepSeek 的多模态能力补齐了其产品短板,在视觉解析与跨模态推理上展现出潜力,开启深度思考模式后能力明显增强。
💡 主要观点
- DeepSeek 识图模式灰度上线,补齐多模态能力短板。 DeepSeek 首页新增识图模式入口,上传图片后能理解画面内容,不再局限于文字识别,这是其产品多模态能力的重要补充。
💬 文章金句
- DeepSeek 的多模态能力已经开启灰度测试。
- DeepSeek 研究员陈德里称,这一功能来自 DeepSeek 的「天才多模态同事们」,小鲸鱼现在有了看见世界的能力。
- AI 走向多模态已经成为不可逆转的大趋势。
📊 文章信息
AI 初评:80
来源:36氪
作者:36氪
分类:人工智能
语言:中文
阅读时间:6 分钟
字数:1372
标签: DeepSeek, 多模态, 识图模式, AI 产品, 灰度测试