Техническое задание: Парсинг каталога сайта
Суть проекта
Необходимо разработать скрипт для сбора данных из каталога товаров на крупном корпоративном сайте. Каталог имеет многоуровневую структуру (разделы, подразделы, категории).
Основные задачи
- Обход всех разделов и подразделов каталога.
- Сбор данных о товарах (название, артикул, характеристики, описание, изображения и т.д.).
- Структурирование данных в удобном формате (например, CSV, JSON, Excel).
- Обеспечение стабильности работы парсера и обработка ошибок.
Требования к исполнителю
- Опыт парсинга сложных сайтов с JavaScript-рендерингом.
- Умение обходить антибот-защиту (при необходимости).
- Понимание структуры данных и умение работать с древовидными каталогами.
- Предоставление чистого, читаемого кода с комментариями.
Что нужно предоставить по итогу
- Рабочий скрипт для парсинга.
- Собранную и структурированную базу данных.
- Краткую документацию по запуску.