Разработка RAG-системы для работы с документами

Необходимо реализовать полноценную систему Retrieval-Augmented Generation (RAG) для организации базы знаний и интеллектуального поиска по документам.

Основные задачи

  • Создать базу данных для чтения и обработки загружаемых файлов различных форматов.
  • Интегрировать векторную базу данных Qdrant для хранения эмбеддингов и семантического поиска.
  • Настроить рабочие процессы (workflows) в n8n для автоматизации обработки документов и запросов.
  • Обеспечить возможность загрузки файлов, их индексации и последующего поиска по содержимому.

Технические требования

  • Система должна позволять загружать текстовые файлы, PDF, DOCX и другие распространенные форматы.
  • Реализовать процесс разбиения документов на чанки, создания векторных представлений и сохранения в Qdrant.
  • Настроить n8n для обработки пользовательских запросов: поиск релевантных фрагментов в базе и генерация ответов.
  • Обеспечить модульную архитектуру для возможного расширения функционала.

Результат работы

Готовая к использованию система, которая принимает файлы, индексирует их содержимое и позволяет получать точные ответы на вопросы на основе загруженных документов через интерфейс n8n.