Google AI запускает Veo 3.1 Lite для быстрого видео по низкой цене
Компания Google анонсировала выход Veo 3.1 Lite, нового уровня модели в своем портфолио генеративного видео, созданного для решения основной проблемы развертывания на производственном уровне: высокой цены. Несмотря на то, что в области генеративного видео наблюдается быстрый прогресс в визуальной четкости, цена за секунду сгенерированного контента оставалась высокой, что часто делает её неприемлемой для разработчиков, создающих приложения с высоким объемом. Veo 3.1 Lite теперь доступен через API Gemini и Google AI Studio для пользователей платного уровня. Предлагая ту же скорость генерации, что и существующая модель Veo 3.1 Fast, но примерно за половину цены, Google позиционирует эту модель как стандарт для разработчиков, сосредоточенных на программном видео и итеративном прототипировании.
Ключевым аспектом семейства Veo 3.1 является его архитектура на основе диффузионного трансформера (DiT). Традиционные модели генерации видео часто основывались на диффузии на основе U-Net, что может затруднять работу с высокоразмерными данными и долгосрочными временными зависимостями. Veo 3.1 Lite использует трансформерную архитектуру, работающую с пространственно-временными патчами. В этой архитектуре видеокадры обрабатываются не как статические 2D-изображения, а как непрерывная последовательность токенов в латентном пространстве. Применяя самовнимание к этим патчам, модель поддерживает лучшую временную согласованность, что обеспечивает согласованность объектов, освещения и текстур на протяжении всего клипа, уменьшая артефакты, часто встречающиеся в более ранних моделях.
Veo 3.1 Lite предоставляет конкретные параметры для разрешения и продолжительности, позволяя разработчикам интегрировать его в структурированные рабочие процессы. В отличие от флагманской модели Veo 3.1, которая поддерживает 4K разрешение, Lite версия оптимизирована для высококачественного (HD) вывода. Поддерживаемые разрешения: 720p и 1080p. Соотношения сторон: нативная поддержка как горизонтальной (16:9), так и портретной (9:16) ориентации. Длительность клипов: разработчики могут указывать длину генерации в 4, 6 или 8 секунд. Модель оптимизирована для «Кинематического контроля», распознавая технические директивы, такие как «панорамирование», «наклон» и конкретные инструкции по освещению.
Структура цен Veo 3.1 Lite является основным предложением ценности. На текущем рынке высококачественная видеоинференция часто стоит несколько долларов за минуту отснятого материала, что затрудняет её оправдание для таких приложений, как динамическое создание рекламы или автоматизация в социальных сетях. Цены на Veo 3.1 Lite составляют: 720p — $0.05 за секунду и 1080p — $0.08 за секунду. Доступ осуществляется через API Gemini, что позволяет интегрировать генерацию видео в существующие приложения на Python или Node.js, используя стандартные вызовы REST или gRPC.
Одной из ключевых технических особенностей для корпоративных разработчиков является включение SynthID. Разработанный Google DeepMind, SynthID является инструментом для водяной маркировки и идентификации AI-сгенерированного контента. Он встраивает цифровую водяную марку непосредственно в пиксели видео, которая незаметна для человеческого глаза, но обнаружима специализированным программным обеспечением. Это обязательный компонент для разработчиков, обеспокоенных безопасностью, соблюдением норм и различением синтетических медиа от отснятого материала.
Обсуждаем GPT-5.4 и самоулучшающийся ИИ
Создайте и развивайте кастомного агента OpenAI с A-Evolve
Похожие статьи
Исследуйте новшества Together AI на NVIDIA GTC 2026
Together AI представляет новшества на NVIDIA GTC 2026, включая новые модели и возможности.
Создавайте пиксельную графику с моделями Retro Diffusion на Replicate
Retro Diffusion представила модели для создания ретро-графики на Replicate.
Сравните модели редактирования изображений для оптимального выбора
Сравните различные модели редактирования изображений и выберите лучшую для своих нужд.