Техническое задание: Парсер сайтов с ИИ-анализом
Цель проекта
Разработать программное решение для автоматического сбора и анализа информации с веб-сайтов. Основная функция - определение сферы деятельности компании и её рыночного сегмента (B2B или B2C) с применением технологий искусственного интеллекта.
Основные задачи
- Создать парсер, способный последовательно обрабатывать сайты из предоставленного списка.
- Интегрировать механизм анализа контента (текстов, метаданных) для классификации вида деятельности компании.
- Реализовать логику определения бизнес-сегмента (B2B или B2C) на основе собранных данных.
- Обеспечить стабильную работу парсера и корректную обработку веб-страниц.
Требования к реализации
- Решение должно быть готово к интеграции с ИИ-моделью или сервисом для классификации текста.
- Парсер должен корректно обрабатывать структурированные списки URL-адресов.
- Важно предусмотреть обработку ошибок (недоступность сайтов, изменения в структуре страниц).
- Результаты работы (определённая деятельность и сегмент для каждого сайта) должны быть сохранены в удобном формате.
Ожидаемый результат
Готовый, отлаженный парсер, который автоматизирует процесс анализа сайтов и предоставляет структурированный отчёт с классификацией по виду деятельности и бизнес-модели.