Задача
Разработать парсер интернет-магазина Wildberries, который обходит категории женской одежды и собирает по каждой категории список представленных брендов.
Основные требования
- Парсер должен идентифицировать каждого продавца (seller) и все бренды, которые ему принадлежат.
- Один продавец может владеть несколькими брендами. Для каждого продавца нужно собрать перечень его брендов.
- Если один и тот же продавец встречается в разных категориях женской одежды, он не дублируется, а дополняется информацией: какие категории он обслуживает (все категории, где найден).
- На выходе должен формироваться структурированный список продавцов, с указанием их брендов и полного перечня категорий по женской одежде.
Формат результата
Ожидается получение данных в формате JSON или табличном виде (CSV/XLSX). Каждый продавец - одна запись со списком его брендов и категорий через разделитель.
Условия работы
- Использовать парсинг через API или статическую версию сайта, без применения Selenium (желательно).
- Учесть защиту от блокировок: паузы между запросами, ротация User-Agent, прокси опционально.
- Не собирать цены, характеристики, отзывы и карточки товаров - только бренды и продавцы.
Готовность к передаче
По итогу работы заказчик получает:
- Исходный код парсера на Python с комментариями.
- Инструкцию по запуску.
- Файл с результатом парсинга.