Google 现已为 Gemini API 推出全新服务层级,提供“flex”模式以降低成本,以及“priority”模式以提升可靠性。
📝 详细摘要
Google Gemini API 产品负责人 Logan Kilpatrick 宣布推出全新的服务层级。开发者现在可以在“flex”模式(在牺牲一定可靠性的前提下,API 成本可降低约 50%)和“priority”模式(成本增加约 80%,以确保更高的吞吐量和可靠性)之间进行选择。此次更新为开发者在构建 AI 应用时提供了对成本与性能权衡的精细化控制。
📊 文章信息
AI 评分:86
来源:Logan Kilpatrick(@OfficialLoganK)
作者:Logan Kilpatrick
分类:人工智能
语言:英文
阅读时间:2 分钟
字数:274
标签: Gemini API, Google, API 成本, AI 基础设施, 模型推理