← 回總覽

Google 为 Gemini API 引入 Flex 和 Priority 推理层级

📅 2026-04-03 03:11 Google AI Developers 人工智能 1 分鐘 537 字 評分: 86
Gemini API Google AI API 优化 推理 云基础设施
📌 一句话摘要 Google AI Developers 为 Gemini API 推出了全新的 Flex 和 Priority 推理层级,旨在帮助开发者平衡成本与可靠性。 📝 详细摘要 Google 更新了 Gemini API,增加了两个新的推理层级:针对成本敏感且可容忍延迟的工作负载的“Flex”(成本降低 50%),以及针对需要高可靠性的关键交互式应用的“Priority”。此次更新结合现有的异步 Batch API,为开发者提供了全套选项,以优化各种用例的性能和支出。 📊 文章信息 AI 评分:86 来源:Google AI Developers(@googleaidevs)

📌 一句话摘要

Google AI Developers 为 Gemini API 推出了全新的 Flex 和 Priority 推理层级,旨在帮助开发者平衡成本与可靠性。

📝 详细摘要

Google 更新了 Gemini API,增加了两个新的推理层级:针对成本敏感且可容忍延迟的工作负载的“Flex”(成本降低 50%),以及针对需要高可靠性的关键交互式应用的“Priority”。此次更新结合现有的异步 Batch API,为开发者提供了全套选项,以优化各种用例的性能和支出。

📊 文章信息

AI 评分:86

来源:Google AI Developers(@googleaidevs)

作者:Google AI Developers

分类:人工智能

语言:英文

阅读时间:2 分钟

字数:430

标签: Gemini API, Google AI, API 优化, 推理, 云基础设施

阅读推文

查看原文 → 發佈: 2026-04-03 03:11:12 收錄: 2026-04-03 06:00:45

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。