Техническое задание: Разработка парсера данных
Цель проекта
Создание автоматизированного решения для сбора структурированной информации с сайта поставщика строительных и отделочных материалов.
Основные задачи парсера
- Обход и анализ структуры категорий товаров на целевом ресурсе.
- Извлечение детальной информации по каждому товару.
Извлекаемые данные
- Артикул товара (уникальный идентификатор).
- Категория и подкатегория (полный путь в каталоге).
- Наименование товара.
- Цена (актуальная стоимость).
- Наличие (статус наличия на складе).
Список категорий для полного парсинга
- Освещение
- Электротовары
- Водоснабжение
- Сантехника
- Плитка
- Скобяные изделия и фурнитура
- Напольные покрытия
- Двери
- Строительные материалы
- Краски и лаки
Особое указание по категории
Для категории «Декор» требуется собрать данные только по подразделу «Обои». Остальные подразделы данной категории парсить не нужно.
Требования к результату
- Программа должна быть отказоустойчивой и корректно обрабатывать ошибки сети или структуры страниц.
- Собранные данные должны быть сохранены в структурированном виде (например, CSV, JSON или база данных).
- Желательна возможность настройки интервалов запросов для соблюдения правил целевого сайта.