Достигаем точности без векторов с Proxy-Pointer RAG
Недавний запуск PageIndex стал частью более широкого сдвига в архитектуре ИИ к "Vectorless RAG" или "Reasoning-Based Retrieval". Вместо стандартного метода разбиения документов на случайные фрагменты и поиска через математическую схожесть, PageIndex строит "Умное оглавление" — иерархическое дерево, которое позволяет языковым моделям навигировать по документам так, как это делает человек-эксперт.
Многочисленные блоги, включая публикацию от Microsoft, описывают рабочие принципы этой технологии, которая достигает 98,7% точности на финансовом бенчмарке, подчеркивая, что Vectorless RAG лучше всего подходит для глубоких запросов по сложным структурированным или полуструктурированным документам, таким как финансовые отчеты. Это связано с тем, что подход PageIndex на основе дерева не может практически масштабироваться на сценарии с несколькими документами.
Основная причина заключается в том, что построение иерархического дерева индекса — это медленный и дорогостоящий процесс, требующий использования языковой модели. В отличие от этого, создание векторного индекса происходит быстро и недорого, а этап извлечения использует языковую модель только один раз во время синтеза ответа.
PageIndex демонстрирует свою точность благодаря трем архитектурным преимуществам: структурной навигации, а не сопоставлению паттернов, извлечению непрерывного контекста и возможности работы с полными секциями, что позволяет избежать необходимости в разбиении на куски.
В этой статье я проведу через реальный случай использования большого сложного документа, чтобы построить Proxy-Pointer RAG — конвейер ввода и извлечения, который достигает высокой точности, сохраняя при этом низкую задержку и стоимость, что делает его масштабируемым для корпоративной базы данных.
Япония использует роботов для решения проблемы нехватки рабочей силы
Познакомьтесь с MaxToki: ИИ, предсказывающий старение клеток
Похожие статьи
Создание интеллектуального аудиопоиска с Amazon Nova Embeddings
Amazon Nova Embeddings преобразует аудиоконтент в интеллектуальные данные для поиска.
Обнаружение галлюцинаций перевода с помощью несоответствия внимания
Нейронные модели машинного перевода подвержены галлюцинациям. Новый метод позволяет оценить неопределенность переводов.
Google выпустила офлайн-приложение для диктовки на базе ИИ
Google представила новое офлайн-приложение для диктовки на iOS, которое использует ИИ для улучшения качества текста.