Обсуждаем GPT-5.4 и самоулучшающийся ИИ

10 просмотров Источник
Обсуждаем GPT-5.4 и самоулучшающийся ИИ

На этой неделе произошло два значительных события в мире искусственного интеллекта, которые на первый взгляд кажутся не связанными, но на самом деле рассказывают одну и ту же историю. В среду OpenAI представила GPT-5.4 — свою новую модель, ориентированную на работу, а в воскресенье Андрей Карпаты опубликовал результаты своего эксперимента по автопоиску, показывающие, что ИИ-агенты могут самостоятельно находить реальные улучшения в обучении нейронных сетей.

Новая модель GPT-5.4

GPT-5.4 была выпущена 5 марта и включает в себя множество новых функций, таких как использование инструментов, возможность поиска и расширенный контекст в 1 миллион токенов. Хотя цена на модель возросла, увеличенная эффективность токенов в значительной степени компенсирует это увеличение.

Сравнение производительности

На различных бенчмарках GPT-5.4 показывает хорошие результаты, но не является однозначным лидером. Например, на Intelligence Index она сравнивается с Gemini 3.1 Pro Preview, а на LiveBench едва опережает его.

  • На GDPval GPT-5.4 достиг 83.0% против 70.9% у GPT-5.2.
  • На задачах моделирования электронных таблиц — 87.3% против 68.4%.
  • На OSWorld-Verified для навигации по рабочему столу — 75.0%, что превышает человеческий базовый уровень.

Эксперимент Андрея Карпаты

Другой важный момент на этой неделе — эксперимент по автопоиску Андрея Карпаты. Он сообщил, что его агент LLM нашел около 20 изменений, которые значительно улучшили процесс обучения, сократив время на обучение на 11%.

Если агент сможет эффективно исследовать параметры настройки и архитектурные детали, это может стать ценным инструментом в исследовательском процессе, даже если это не выглядит как создание совершенно новой парадигмы.

Похожие статьи