Оптимизируйте затраты и надежность с Gemini API

6 просмотров Источник
Оптимизируйте затраты и надежность с Gemini API

Компания Google представила новые уровни услуг для API Gemini: Flex и Priority, которые позволяют разработчикам оптимизировать затраты и надежность через единый интерфейс. Эти нововведения помогут упростить управление архитектурой, обеспечивая возможность маршрутизации фоновых и интерактивных задач с использованием стандартных синхронных конечных точек.

Flex Inference — это новый оптимизированный по стоимости уровень, предназначенный для задач, не требующих мгновенной реакции. Он предлагает 50% экономии по сравнению с обычным API, позволяя снизить критичность запросов и увеличить задержку. Это идеальный выбор для обновлений CRM, масштабных исследовательских симуляций и фоновых рабочих процессов.

С другой стороны, Priority Inference обеспечивает наивысший уровень надежности для критически важных приложений. Этот уровень гарантирует, что важные запросы не будут прерваны даже в периоды максимальной нагрузки на платформу. При превышении лимитов Priority, переполняющие запросы автоматически обрабатываются на стандартном уровне, что позволяет сохранить работоспособность приложения.

Использование новых уровней услуг просто: достаточно настроить параметр service_tier в запросе. Flex доступен для всех платных уровней, а Priority — для пользователей с проектами второго и третьего уровня. Полная информация о ценах и примеры кода доступны в документации API Gemini.

Похожие статьи