Shubham Saboo 推出了一款基于 Gemini Embedding 2 的开源多模态语义视频搜索工具,支持文本和图像查询。
📝 详细摘要
这条推文展示了一个全新的开源项目,实现了视频的多模态语义搜索。该工具利用 Gemini Embedding 2,允许用户通过文本输入或图像查询进行搜索,展示了多模态向量嵌入(Embeddings)在视频检索中的实际应用。
📊 文章信息
AI 评分:81
来源:Shubham Saboo(@Saboo_Shubham_)
作者:Shubham Saboo
分类:人工智能
语言:英文
阅读时间:1 分钟
字数:130
标签: Gemini, 多模态, 视频搜索, 开源, 向量嵌入