Задача

Требуется внедрить RAG-архитектуру (Retrieval-Augmented Generation) в уже работающий чатбот компании. На данный момент бот не умеет отвечать на вопросы пользователей.

Исходные данные

  • Текущий чатбот компании (без функции ответов на свободные вопросы).
  • База запросов пользователей организации (примерно 3000 записей).
  • Сайт компании - источник дополнительной информации.

Цель

Разработать и интегрировать RAG-модуль, который позволит боту релевантно отвечать на вопросы, используя подготовленную базу знаний и данные с сайта.

Требования к реализации

  • Обработка существующей базы запросов (3000 шт.) как источника знаний.
  • Автоматический сбор и индексация данных с сайта компании.
  • Внедрение готовой LLM (любой, на выбор разработчика) для генерации ответов.
  • Механизм извлечения релевантных документов/фрагментов по запросу пользователя.
  • Оформление результата в виде модуля, который легко встраивается в текущего бота.

Дополнительно

Желательно обеспечить возможность обновления базы знаний без полной переиндексации при добавлении новых данных. Архитектура должна быть масштабируемой.