Обсуждаем GPT-5.4 и самоулучшающийся ИИ
На этой неделе произошло два значительных события в мире искусственного интеллекта, которые на первый взгляд кажутся не связанными, но на самом деле рассказывают одну и ту же историю. В среду OpenAI представила GPT-5.4 — свою новую модель, ориентированную на работу, а в воскресенье Андрей Карпаты опубликовал результаты своего эксперимента по автопоиску, показывающие, что ИИ-агенты могут самостоятельно находить реальные улучшения в обучении нейронных сетей.
Новая модель GPT-5.4
GPT-5.4 была выпущена 5 марта и включает в себя множество новых функций, таких как использование инструментов, возможность поиска и расширенный контекст в 1 миллион токенов. Хотя цена на модель возросла, увеличенная эффективность токенов в значительной степени компенсирует это увеличение.
Сравнение производительности
На различных бенчмарках GPT-5.4 показывает хорошие результаты, но не является однозначным лидером. Например, на Intelligence Index она сравнивается с Gemini 3.1 Pro Preview, а на LiveBench едва опережает его.
- На GDPval GPT-5.4 достиг 83.0% против 70.9% у GPT-5.2.
- На задачах моделирования электронных таблиц — 87.3% против 68.4%.
- На OSWorld-Verified для навигации по рабочему столу — 75.0%, что превышает человеческий базовый уровень.
Эксперимент Андрея Карпаты
Другой важный момент на этой неделе — эксперимент по автопоиску Андрея Карпаты. Он сообщил, что его агент LLM нашел около 20 изменений, которые значительно улучшили процесс обучения, сократив время на обучение на 11%.
Если агент сможет эффективно исследовать параметры настройки и архитектурные детали, это может стать ценным инструментом в исследовательском процессе, даже если это не выглядит как создание совершенно новой парадигмы.
Создайте собственного локального AI-агента с OpenClaw и Obsidian
Hugging Face запускает TRL v1.0: унифицированный стек постобучения
Похожие статьи
Исследуйте новшества Together AI на NVIDIA GTC 2026
Together AI представляет новшества на NVIDIA GTC 2026, включая новые модели и возможности.
Создавайте пиксельную графику с моделями Retro Diffusion на Replicate
Retro Diffusion представила модели для создания ретро-графики на Replicate.
Сравните модели редактирования изображений для оптимального выбора
Сравните различные модели редактирования изображений и выберите лучшую для своих нужд.