Цель проекта
Автоматизировать процесс разбора и анализа смет (в формате PDF с текстом). На основе загруженного документа ИИ должен распознать наименования оборудования и их количество, затем найти актуальные цены на пяти заранее выбранных сайтах и вывести итоговый отчет в Excel с усредненной ценой.
Основные функции сервиса
- Прием на вход PDF-сметы (только с текстовым содержанием);
- Автоматическое распознавание наименований и количества оборудования через API выбранного грамм‑образца (например, модели генеративного ИИ);
- Поиск каждого наименования на пяти заранее заданных сайтах интернет-магазинов/каталогов (ссылки на утилиты типа Firecrawl приветствуются для ускорения);
- Расчет усредненной цены на основе найденных данных;
- Формирование и выгрузка Excel-файла с ‘таб.1 - Итоги’ (заголовки, количество, средняя цена, список найденных цен).
Технические требования
- Разработка: веб-сервис, развертывается на моем сервере;
- Паель с прокси для работы API LLM (необходимые ключи и прокси предоставлю);
- Желательно упростить парсинг страниц через интеграцию с aimecrawl/Feeds шенталом (использование готовых решений приветствуется, например, firecrawl);
- Автоматизация не требуется в режиме микро-шагов, достаточно одного запроса: «пришел файл ‑› результат в Excel».
Ожидаемый результат
Готовый веб‑сервис, который каждый раз при загрузке PDF:
- распознаёт текст с помощью детали чернови да;
- поиски выполяет в пане ок зме данные ;
- выдаёт на страницах лички XLS-файл.