WebAI 开源了 ColVec1 多模态检索模型,在 ViDoRe V3 基准排名第一和第三,无需 OCR 即可直接检索图像内容,并提供 4B 和 9B 两个版本。
📝 详细摘要
这条推文宣布了 WebAI 公司开源其多模态检索模型 ColVec1 的消息。该模型在 ViDoRe V3 基准测试中取得了第一名和第三名的成绩。其核心创新在于完全跳过了传统的 OCR 步骤,能够直接理解页面图片内容进行检索,可处理表格、图表、扫描件等多种复杂文档。模型提供了 4B 和 9B 两个参数量版本,适合边缘设备部署。推文认为这标志着多模态检索进入了「真正聪明检索」的时代,而不仅仅是依赖模型规模缩放。推文引用了原项目发布推文,并附上了模型和博客的链接。
📊 文章信息
AI 初评:83
来源:Berryxia.AI(@berryxia)
作者:Berryxia.AI
分类:人工智能
语言:中文
阅读时间:2 分钟
字数:297
标签: 多模态 RAG, ColVec1, 开源模型, ViDoRe 基准, WebAI