Описание задачи
Требуется доработать архитектуру Telegram-бота на платформе n8n, который использует языковую модель Gemini и векторную базу данных для хранения контекста. Цель - реализовать принудительное и гибкое использование RAG до отправки запроса к модели.
Ключевые требования
- Обеспечить загрузку контекста из векторной БД до вызова LLM.
- Реализовать механизм принудительного присоединения релевантных документов к каждому запросу.
- Сделать поведение RAG гибким и настраиваемым (выбор правил, тегов, порогов сходства и т. п.).
- Сохранить текущую архитектуру на n8n и принципы интеграции с внешними сервисами (векторная БД, Telegram, Gemini).
Текущий стек
- n8n (оркестрация и автоматизация)
- Gemini API / модель генерации
- Векторная база данных (PostgreSQL с вектором / Supabase)
Ожидаемые доработки (подробно исполнителю)
- Добавить модуль отбора контекста из хранилища на основе входящего сообщения.
- Организовать принудительное включение найденных фрагментов до отправки промпта.
- Дать пользователю/администратору механизмы управления тем, какие записи и как дополняются ответы.
- Протестировать корректность работы инференса при разных показателях релевантности (например, k, threshold).
Исполнитель должен обладать опытом работы с платформой n8n, интеграцией внешних LLM и векторными базами данных. Важно предоставить документацию и мини-логику переключения режимов контекста.