Gemini Embedding 2 支持交错式多模态输入和 100 多种语言,并可在单次 API 调用中提供灵活的输出维度。
📝 详细摘要
作为技术细节的补充,本推文详细介绍了 Gemini Embedding 2 的核心能力:支持包含文本、图像、视频、音频和 PDF 的交错式嵌入,具备 100 多种语言的语义理解能力,提供灵活的输出维度(128 到 3072),并通过在单次 API 调用中原生处理多模态输入来简化工作流,消除了中间处理步骤。
📊 文章信息
AI 评分:89
来源:Google AI Developers(@googleaidevs)
作者:Google AI Developers
分类:人工智能
语言:英文
阅读时间:3 分钟
字数:585
标签: 多模态搜索, 语义理解, API 集成, Gemini 架构, 技术规格