MiniMax представляет MMX-CLI: интерфейс командной строки для ИИ-агентов

3 просмотров Источник
MiniMax представляет MMX-CLI: интерфейс командной строки для ИИ-агентов

Компания MiniMax, занимающаяся исследованиями в области искусственного интеллекта, представила MMX-CLI — интерфейс командной строки на базе Node.js, который открывает полный спектр генеративных возможностей платформы MiniMax как для разработчиков, работающих в терминале, так и для ИИ-агентов, использующих инструменты, такие как Cursor, Claude Code и OpenCode.

Современные агенты, основанные на больших языковых моделях (LLM), хорошо справляются с чтением и написанием текста, могут рассуждать над документами, генерировать код и отвечать на многоходовые инструкции. Однако у них нет прямого доступа к генерации медиа, так как для этого требуется отдельный интеграционный слой, например, Model Context Protocol (MCP). Создание таких интеграций обычно требует написания пользовательских API-оберток и настройки серверного инструментария, что усложняет процесс.

MMX-CLI предлагает альтернативный подход, позволяя вызывать все эти возможности в виде команд оболочки, которые агент может напрямую использовать, как это делает разработчик в терминале, без необходимости в MCP. Интерфейс включает семь генеративных команд: mmx text, mmx image, mmx video, mmx speech, mmx music, mmx vision и mmx search, а также вспомогательные утилиты.

Команда mmx text поддерживает многоходовой чат, потоковый вывод и режим JSON. Команда mmx image генерирует изображения по текстовым подсказкам с возможностью управления соотношением сторон и количеством. Команда mmx video использует MiniMax-Hailuo-2.3 по умолчанию и позволяет генерировать видео с использованием заданного изображения в качестве начального кадра.

Команда mmx speech обеспечивает синтез речи с более чем 30 доступными голосами и возможностью управления скоростью и громкостью. Команда mmx music генерирует музыку на основе текстовой подсказки с тонкими настройками композиции. Команда mmx vision позволяет анализировать изображения с помощью модели, понимающей визуальный контент, а mmx search выполняет веб-поиск через собственную инфраструктуру MiniMax.

MMX-CLI написан в основном на TypeScript и использует Bun для разработки и тестирования, что делает его совместимым с Node.js 18+. Интерфейс спроектирован для программного и агентского использования, что значительно снижает барьер интеграции для разработчиков, создающих системы на основе агентов.

Похожие статьи