NVIDIA представляет Nemotron 3 Super с 5-кратной производительностью
Сегодня была представлена модель NVIDIA Nemotron 3 Super, обладающая 120 миллиардами параметров, из которых 12 миллиардов активны. Эта модель предназначена для работы с сложными системами агентного ИИ и обеспечивает высокую точность выполнения задач. Компании, такие как Perplexity, уже интегрировали Nemotron 3 Super в свои решения для поиска и разработки программного обеспечения, что позволяет значительно повысить точность и снизить затраты.
Лидеры отрасли, такие как Amdocs и Palantir, используют модель для автоматизации рабочих процессов в таких сферах, как телекоммуникации и кибербезопасность. Однако компании сталкиваются с двумя основными проблемами: взрывом контекста и налогом на мышление. Nemotron 3 Super решает эти проблемы, предлагая окно контекста в 1 миллион токенов, что позволяет агентам сохранять полное состояние рабочего процесса в памяти.
Модель также демонстрирует выдающиеся результаты в тестах на эффективность и открытость, занимая лидирующие позиции в бенчмарках, измеряющих способность ИИ проводить многослойные исследования. Архитектура модели сочетает в себе несколько инноваций, которые обеспечивают до 5 раз большую пропускную способность и до 2 раз большую точность по сравнению с предыдущей моделью.
NVIDIA предоставляет Nemotron 3 Super с открытыми весами, что позволяет разработчикам настраивать модель для работы в облаке или на локальных серверах. Модель была обучена на синтетических данных, и NVIDIA публикует полную методологию обучения, включая более 10 триллионов токенов данных.
Nemotron 3 Super предназначен для выполнения сложных подзадач в рамках многоагентных систем, что позволяет значительно повысить эффективность в таких областях, как финансовый анализ и автоматизация кибербезопасности. Модель доступна через различные облачные сервисы и партнеров, таких как Google Cloud и Amazon Web Services, что упрощает её внедрение в бизнес-процессы.
NVIDIA запускает локальные AI-агенты на RTX и DGX Spark
NVIDIA развивает автономные сети с помощью агентного ИИ
Похожие статьи
Amazon SageMaker HyperPod оптимизирует инференс для AI моделей
Amazon SageMaker HyperPod предлагает решение для эффективного инференса AI моделей.
Оптимизированные развертывания в SageMaker JumpStart
Amazon SageMaker JumpStart запускает оптимизированные развертывания для различных задач.
AWS представляет фреймворк Path-to-Value для генеративного ИИ
AWS представил фреймворк Path-to-Value для успешного внедрения генеративного ИИ.