Понимание жизненного цикла моделей Amazon Bedrock
Amazon Bedrock регулярно выпускает новые версии базовых моделей (FM), обладающих улучшенными возможностями, точностью и безопасностью. Понимание жизненного цикла моделей имеет важное значение для эффективного планирования и управления AI-приложениями, построенными на Amazon Bedrock. Перед миграцией приложений вы можете протестировать эти модели через консоль Amazon Bedrock или API, чтобы оценить их производительность и совместимость.
В этой статье рассматриваются три состояния жизненного цикла моделей, а также как планировать миграции с помощью новой функции расширенного доступа, и практические стратегии для перехода ваших приложений на новые модели без сбоев. Модель, предлагаемая на Amazon Bedrock, может находиться в одном из трех состояний: Активная, Устаревшая или Завершение срока службы (EOL). Текущий статус модели виден как в консоли Amazon Bedrock, так и в ответах API.
Активные модели получают постоянное обслуживание, обновления и исправления ошибок от своих поставщиков. В то время как модель активна, вы можете использовать ее для вывода через API, настраивать ее (если это поддерживается) и запрашивать увеличение квоты через AWS Service Quotas. Когда поставщик модели переводит модель в состояние Устаревшая, Amazon Bedrock уведомит клиентов за 6 месяцев до даты EOL, предоставляя необходимое время для планирования и выполнения миграции на новые или альтернативные версии моделей.
Во время Устаревшего периода существующие клиенты могут продолжать использовать модель, хотя новые клиенты могут не иметь к ней доступа. Организации должны отметить, что создание новых единиц пропускной способности становится недоступным, и возможности настройки модели могут столкнуться с ограничениями. Для моделей с датами EOL после 1 февраля 2026 года Amazon Bedrock вводит дополнительную фазу в Устаревшем состоянии: Публичный период расширенного доступа. После того как модель проведет минимум 3 месяца в состоянии Устаревшая, она переходит в этот расширенный доступ.
Когда модель достигает своей даты EOL, она становится полностью недоступной во всех регионах AWS, если специально не указано в списке EOL. Запросы API к моделям EOL будут завершаться неудачей, делая их недоступными для большинства клиентов, если не существует специальных соглашений между клиентом и поставщиком о продолжении доступа. Переход к EOL требует проактивных действий со стороны клиента — миграция не происходит автоматически.
Клиенты получат уведомление за 6 месяцев до даты EOL модели, когда поставщик модели переводит модель в состояние Устаревшая. Этот проактивный подход к коммуникации обеспечивает клиентам достаточное время для планирования и выполнения своих стратегий миграции. Уведомления содержат детали о модели, которая будет устаревшей, важные даты и доступность расширенного доступа.
Снижение затрат на контрольные точки при помощи Python и NVIDIA nvCOMP
AWS представила реестр агентов для упрощения управления на предприятиях
Похожие статьи
Google запускает функцию 'Skills' в Chrome для работы с AI-подсказками
Google запускает 'Skills' в Chrome для управления AI-подсказками.
Создание рабочего процесса Crawl4AI для веб-сканирования и извлечения данных
Изучите, как настроить рабочий процесс Crawl4AI для веб-сканирования и извлечения данных.
Amazon SageMaker HyperPod оптимизирует инференс для AI моделей
Amazon SageMaker HyperPod предлагает решение для эффективного инференса AI моделей.