Разработка MVP ассистента для обработки документов
Цель проекта - быстро создать работающий прототип (MVP) интеллектуального ассистента для обработки и поиска информации в документах с использованием RAG-архитектуры.
Основные функциональные блоки
1. Поток обработки документов (Ingest)
- Извлечение текста из документов с помощью OCR (Yandex OCR).
- Разбивка текста на смысловые фрагменты (чанки).
- Генерация векторных представлений (эмбеддингов) для каждого фрагмента.
- Сохранение векторов и метаданных в векторную базу данных Qdrant.
2. Поток общения (Chat)
- Реализация диалогового интерфейса в Telegram-боте.
- Семантический поиск по базе документов (RAG) с использованием YandexGPT.
- Формирование ответов с цитатами из исходных документов.
- Реализация интерактивных inline-кнопок в интерфейсе бота.
3. Интеграция с CRM-системой
- Настройка автоматической публикации результатов или уведомлений в CRM (Bitrix24).
Технические требования
- Основная платформа для оркестрации процессов: n8n Cloud.
- Интеграция со сторонними сервисами: Telegram, Bitrix24, Qdrant, Yandex Cloud (OCR и GPT).
- Архитектура должна быть модульной и готовой к дальнейшему масштабированию.
Ожидаемый результат
Рабочий MVP, позволяющий загружать документы, задавать вопросы по их содержимому на естественном языке и получать точные ответы с ссылками на источник, а также интегрировать эту функциональность в рабочий процесс через CRM.