Google AI Developers 为 Gemini API 推出了全新的 Flex 和 Priority 推理层级,旨在帮助开发者平衡成本与可靠性。
📝 详细摘要
Google 更新了 Gemini API,增加了两个新的推理层级:针对成本敏感且可容忍延迟的工作负载的“Flex”(成本降低 50%),以及针对需要高可靠性的关键交互式应用的“Priority”。此次更新结合现有的异步 Batch API,为开发者提供了全套选项,以优化各种用例的性能和支出。
📊 文章信息
AI 评分:86
来源:Google AI Developers(@googleaidevs)
作者:Google AI Developers
分类:人工智能
语言:英文
阅读时间:2 分钟
字数:430
标签: Gemini API, Google AI, API 优化, 推理, 云基础设施