NVIDIA представляет Nemotron 3 Super с 5-кратной производительностью

Сегодня была представлена модель NVIDIA Nemotron 3 Super, обладающая 120 миллиардами параметров, из которых 12 миллиардов активны. Эта модель предназначена для работы с сложными системами агентного ИИ и обеспечивает высокую точность выполнения задач. Компании, такие как Perplexity, уже интегрировали Nemotron 3 Super в свои решения для поиска и разработки программного обеспечения, что позволяет значительно повысить точность и снизить затраты.

Лидеры отрасли, такие как Amdocs и Palantir, используют модель для автоматизации рабочих процессов в таких сферах, как телекоммуникации и кибербезопасность. Однако компании сталкиваются с двумя основными проблемами: взрывом контекста и налогом на мышление. Nemotron 3 Super решает эти проблемы, предлагая окно контекста в 1 миллион токенов, что позволяет агентам сохранять полное состояние рабочего процесса в памяти.

Модель также демонстрирует выдающиеся результаты в тестах на эффективность и открытость, занимая лидирующие позиции в бенчмарках, измеряющих способность ИИ проводить многослойные исследования. Архитектура модели сочетает в себе несколько инноваций, которые обеспечивают до 5 раз большую пропускную способность и до 2 раз большую точность по сравнению с предыдущей моделью.

NVIDIA предоставляет Nemotron 3 Super с открытыми весами, что позволяет разработчикам настраивать модель для работы в облаке или на локальных серверах. Модель была обучена на синтетических данных, и NVIDIA публикует полную методологию обучения, включая более 10 триллионов токенов данных.

Nemotron 3 Super предназначен для выполнения сложных подзадач в рамках многоагентных систем, что позволяет значительно повысить эффективность в таких областях, как финансовый анализ и автоматизация кибербезопасности. Модель доступна через различные облачные сервисы и партнеров, таких как Google Cloud и Amazon Web Services, что упрощает её внедрение в бизнес-процессы.

NVIDIA представляет Nemotron 3 Super с 5-кратной производительностью

Похожие статьи

Amazon SageMaker HyperPod оптимизирует инференс для AI моделей

Оптимизированные развертывания в SageMaker JumpStart

AWS представляет фреймворк Path-to-Value для генеративного ИИ