Google DeepMind 发布 Gemini Embedding 2,这是其首个多模态模型,可将文本、图像、音频、视频和 PDF 嵌入到统一的向量空间中。
📝 详细摘要
来自 Google DeepMind 的 Patrick Loeber 宣布推出 Gemini Embedding 2,这是一款 SOTA(业界领先)的多模态嵌入模型。此次发布具有里程碑意义,因为它允许包括视频和 PDF 等复杂格式在内的多种数据类型共存于同一嵌入空间,从而实现更强大的多模态搜索和检索增强生成(RAG)工作流。目前在 Google AI Studio 中已提供演示应用来展示这些功能。
📊 文章信息
AI 评分:88
来源:Patrick Loeber(@patloeber)
作者:Patrick Loeber
分类:人工智能
语言:英文
阅读时间:1 分钟
字数:203
标签: Gemini Embedding 2, 多模态 AI, Google DeepMind, 向量嵌入, RAG