MiniMax представляет MMX-CLI: интерфейс командной строки для ИИ-агентов
Компания MiniMax, занимающаяся исследованиями в области искусственного интеллекта, представила MMX-CLI — интерфейс командной строки на базе Node.js, который открывает полный спектр генеративных возможностей платформы MiniMax как для разработчиков, работающих в терминале, так и для ИИ-агентов, использующих инструменты, такие как Cursor, Claude Code и OpenCode.
Современные агенты, основанные на больших языковых моделях (LLM), хорошо справляются с чтением и написанием текста, могут рассуждать над документами, генерировать код и отвечать на многоходовые инструкции. Однако у них нет прямого доступа к генерации медиа, так как для этого требуется отдельный интеграционный слой, например, Model Context Protocol (MCP). Создание таких интеграций обычно требует написания пользовательских API-оберток и настройки серверного инструментария, что усложняет процесс.
MMX-CLI предлагает альтернативный подход, позволяя вызывать все эти возможности в виде команд оболочки, которые агент может напрямую использовать, как это делает разработчик в терминале, без необходимости в MCP. Интерфейс включает семь генеративных команд: mmx text, mmx image, mmx video, mmx speech, mmx music, mmx vision и mmx search, а также вспомогательные утилиты.
Команда mmx text поддерживает многоходовой чат, потоковый вывод и режим JSON. Команда mmx image генерирует изображения по текстовым подсказкам с возможностью управления соотношением сторон и количеством. Команда mmx video использует MiniMax-Hailuo-2.3 по умолчанию и позволяет генерировать видео с использованием заданного изображения в качестве начального кадра.
Команда mmx speech обеспечивает синтез речи с более чем 30 доступными голосами и возможностью управления скоростью и громкостью. Команда mmx music генерирует музыку на основе текстовой подсказки с тонкими настройками композиции. Команда mmx vision позволяет анализировать изображения с помощью модели, понимающей визуальный контент, а mmx search выполняет веб-поиск через собственную инфраструктуру MiniMax.
MMX-CLI написан в основном на TypeScript и использует Bun для разработки и тестирования, что делает его совместимым с Node.js 18+. Интерфейс спроектирован для программного и агентского использования, что значительно снижает барьер интеграции для разработчиков, создающих системы на основе агентов.
Создание рабочего процесса для Microsoft VibeVoice с ASR и TTS
Создание мини-компьютера внутри трансформера для выполнения программ
Похожие статьи
Пользователи сообщают о снижении производительности Claude от Anthropic
Пользователи сообщают о снижении производительности моделей Claude от Anthropic, вызывая дискуссии о качестве продукта.
Создание рабочего процесса для Microsoft VibeVoice с ASR и TTS
Изучение Microsoft VibeVoice: создание рабочего процесса для ASR и TTS.
Проблема хранения памяти в ИИ: недостатки традиционных систем
Проблемы традиционных систем памяти в ИИ и необходимость их улучшения.