Anthropic представила Claude Opus 4.7, обгоняя конкурентов в LLM

1 просмотров Источник
Anthropic представила Claude Opus 4.7, обгоняя конкурентов в LLM

Компания Anthropic анонсировала выпуск своей самой мощной языковой модели Claude Opus 4.7, которая теперь доступна для широкой публики. Эта модель обходит своих ближайших соперников, таких как GPT-5.4 от OpenAI и Gemini 3.1 Pro от Google, по ключевым показателям, включая программирование, использование инструментов и финансовый анализ. Несмотря на это, конкуренция остаётся напряжённой, так как Opus 4.7 лишь незначительно опережает GPT-5.4 по сравнению с аналогичными тестами.

На данный момент Opus 4.7 занимает лидирующие позиции на рынке, получив оценку Elo 1753 в тесте GDPVal-AA, что значительно выше, чем у GPT-5.4 (1674) и Gemini 3.1 Pro (1314). Однако модель не является абсолютным победителем во всех категориях, так как её конкуренты по-прежнему лидируют в определённых областях, таких как агентный поиск и многоязычные вопросы и ответы.

Claude Opus 4.7 доступна на всех крупных облачных платформах, включая Amazon Bedrock и Google Cloud. Цены на API остаются на уровне $5/$25 за миллион токенов. Модель представляет собой эволюцию архитектуры Opus 4.6, с улучшениями в области программной инженерии и обработки сложных документов.

Одним из значительных улучшений стало добавление поддержки мультимодальных данных с высоким разрешением, что позволяет модели обрабатывать изображения до 2576 пикселей на длинной стороне. Это значительно увеличивает её возможности в задачах, требующих высокой точности визуального восприятия.

Однако, Anthropic предупреждает, что новая модель требует изменений в подходах к формулировке запросов. Opus 4.7 следует указаниям буквально, что может потребовать перенастройки старых библиотек запросов для избежания неожиданных результатов. Кроме того, новая модель имеет тенденцию к более глубокому анализу задач, что может увеличить потребление токенов и время отклика.

Для управления расходами на токены, Claude API внедряет новую функцию «бюджеты задач», позволяющую разработчикам устанавливать лимиты на затраты токенов для автономных агентов. Эти изменения сигнализируют о зрелости рынка ИИ, где технологии требуют финансового и операционного контроля.

Похожие статьи