Создайте последовательных персонажей с новыми моделями
До недавнего времени лучшим способом генерации изображений последовательного персонажа был обученный lora. Для этого необходимо было создать датасет изображений и затем обучить на них FLUX lora. Если вспомнить еще дальше, то можно упомянуть о работе с ComfyUI, которая сочетала в себе SDXL, controlnets, IPAdapters и некоторые некоммерческие модели для определения черт лица. Однако сегодня все стало значительно проще. У нас есть выбор современных моделей изображений, которые могут делать это точно на основе единственной ссылки.
На данный момент, в июле 2025 года, существует четыре модели на платформе Replicate, которые могут создавать реалистичный и точный результат с одной ссылки. В порядке выпуска: gpt-image-1 от OpenAI, Gen-4 Image от Runway, FLUX.1 Kontext от Black Forest Labs и SeedEdit 3 от Bytedance. С момента написания этой статьи также были выпущены две новые модели: Character от Ideogram и Gen-4 Image Turbo от Runway. FLUX.1 Kontext доступен в нескольких вариантах: pro, max и dev, где dev является открытой версией, более управляемой и адаптируемой, но менее мощной.
Для написания этой статьи я собрал небольшой модельный проект на Replicate, чтобы упростить сравнение результатов. Модель сравнения запускает FLUX.1 Kontext, SeedEdit 3.0, gpt-image-1 и Gen-4 Image параллельно. Стоимость и скорость работы моделей также важны: gpt-image-1 является самым медленным и дорогим, тогда как Kontext Dev — самым дешевым и быстрым. Однако компромиссы заключаются в качестве, и это стоит рассмотреть более подробно.
Сравнивая, как каждая модель сохраняет идентичность персонажа, мы используем gpt-image-1 с высокими настройками качества и точности, а также FLUX.1 Kontext Pro как лучший компромисс между качеством и скоростью. В примерах, показывающих фотографическую точность, видно, что Gen-4 демонстрирует наилучшие результаты в композиции и точности персонажа.
При изменении сцены, если необходимо сохранить оригинальную композицию и изменить лишь небольшую часть, все модели справляются с этой задачей. Однако при более сложных запросах, таких как изменение внешнего вида персонажа, результаты могут варьироваться. Например, только SeedEdit 3 и gpt-image-1 смогли корректно обработать запрос на чистое лицо, но gpt-image-1 в итоге создал совершенно другого человека.
В заключение, мы пришли к выводу, что Kontext Pro универсален и может давать отличные результаты, но часто возникают артефакты вокруг лица, которые делают изображение непригодным. gpt-image-1 всегда добавляет отличительные черты, но не всегда может предоставить желаемое качество.
Создайте музыку с Lyria 3, новой моделью генерации
Изучите возможности Seedream 5.0 для создания изображений
Похожие статьи
Anthropic столкнулась с проблемами из-за утечек данных
Anthropic столкнулась с утечками данных, раскрывающими важные аспекты её технологий.
Понимание инверсной ошибки в безопасном AGI
Исследуем инверсную ошибку в AI и необходимость физического опыта для безопасного AGI.
Как модель в 10,000 раз меньше ChatGPT обходит его по умению
Модель в 10,000 раз меньше ChatGPT может обойти его, позволяя размышлять.