DeepSeek 终于能看图了！我第一时间用它算命

📌 一句话摘要

DeepSeek 灰度上线识图模式，支持多模态理解，本文通过识物、定位、视觉陷阱、手相等测试展示了其能力。

📝 详细摘要

本文报道了 DeepSeek 多模态识图模式灰度上线的消息。作者被灰度选中后，进行了多项测试：识别兔子品种、根据建筑风格和路灯字样定位灵隐寺并给出经纬度、识别视觉陷阱图片、通过无文字照片推断拍摄地点（精确到北京昌平区）。文章还测试了手相分析功能，指出 DeepSeek 存在左右手判断错误的问题。文章认为，DeepSeek 的多模态能力补齐了其产品短板，在视觉解析与跨模态推理上展现出潜力，开启深度思考模式后能力明显增强。

💡 主要观点

- DeepSeek 识图模式灰度上线，补齐多模态能力短板。 DeepSeek 首页新增识图模式入口，上传图片后能理解画面内容，不再局限于文字识别，这是其产品多模态能力的重要补充。

识图能力在多项测试中表现良好，具备定位和推理能力。 测试涵盖识物、定位、视觉陷阱、手相分析等场景，DeepSeek 能准确识别物体、根据细节推断地理位置，开启深度思考后推理能力显著增强。

手相分析功能存在左右手判断错误的问题。 在手相测试中，DeepSeek 将上传的左手图片误判为右手，说明其在某些细节识别上仍有不足，功能尚处于测试阶段。

💬 文章金句

- DeepSeek 的多模态能力已经开启灰度测试。

DeepSeek 研究员陈德里称，这一功能来自 DeepSeek 的「天才多模态同事们」，小鲸鱼现在有了看见世界的能力。
AI 走向多模态已经成为不可逆转的大趋势。

📊 文章信息

AI 初评：80

来源：36氪

作者：36氪

分类：人工智能

语言：中文

阅读时间：6 分钟

字数：1372

标签： DeepSeek, 多模态, 识图模式, AI 产品, 灰度测试

阅读完整文章

DeepSeek 终于能看图了！我第一时间用它算命

🤖 問 AI