Техническое задание: Разработка базы знаний RAG для ИИ-агента
Имеется исходный массив информации, представленный в виде неструктурированного документа. Цель проекта - преобразовать эти данные в качественную, готовую к использованию базу знаний для RAG-системы (Retrieval-Augmented Generation), которая будет интегрирована в ИИ-агента.
Основные этапы работ:
- Подготовка базы знаний: Организация и систематизация исходного информационного потока.
- Экспорт данных: Извлечение контента из исходного документа для последующей обработки.
- Структурирование по категориям: Логическая группировка информации по темам, разделам или типам данных для эффективного поиска.
- Чистка данных: Удаление дубликатов, приведение к единому формату, исправление ошибок и оптимизация контента для машинного чтения.
Требования к результату:
- База данных должна быть совместима с архитектурой RAG.
- Информация должна быть четко категоризирована и легко извлекаема.
- Исходный контент должен быть очищен от мусора и нерелевантных данных.
- Формат итоговых данных должен быть согласован с исполнителем.