Разработка RAG-системы для работы с документами
Необходимо реализовать полноценную систему Retrieval-Augmented Generation (RAG) для организации базы знаний и интеллектуального поиска по документам.
Основные задачи
- Создать базу данных для чтения и обработки загружаемых файлов различных форматов.
- Интегрировать векторную базу данных Qdrant для хранения эмбеддингов и семантического поиска.
- Настроить рабочие процессы (workflows) в n8n для автоматизации обработки документов и запросов.
- Обеспечить возможность загрузки файлов, их индексации и последующего поиска по содержимому.
Технические требования
- Система должна позволять загружать текстовые файлы, PDF, DOCX и другие распространенные форматы.
- Реализовать процесс разбиения документов на чанки, создания векторных представлений и сохранения в Qdrant.
- Настроить n8n для обработки пользовательских запросов: поиск релевантных фрагментов в базе и генерация ответов.
- Обеспечить модульную архитектуру для возможного расширения функционала.
Результат работы
Готовая к использованию система, которая принимает файлы, индексирует их содержимое и позволяет получать точные ответы на вопросы на основе загруженных документов через интерфейс n8n.