Задача

Необходимо спарсить информацию о товарах с интернет-магазина, чтобы наполнить ими CSV-прайс-лист. Данные должны быть собраны из категорий, посвященных светильникам и освещению.

Что нужно собрать

  • Названия товаров (наименования)
  • Изображения (фото, ссылки на медиа файлы)
  • Характеристики (размеры, материалы, комплектация и т.д.)
  • Цены (актуальная стоимость)
  • Другие базовые поля (артикул, наличие и пр.)

Какие разделы следует игнорировать

  • Раздел мебели
  • Товары бытовой химии
  • Отдельные категории, не относящиеся к свету (декор, посуда и т.д., если обнаружены)

Технические требования

  • Итоговый файл должен быть в формате CSV (кодировка UTF-8, разделитель запятая)
  • Первая строка - названия столбцов
  • Парсинг выполнить с сохранением карточек товаров без погрешностей и пропусков
  • Паузы между запросами, обработка ошибок и безопасное скроллирование страниц/пагинации
  • При наличии капчи - объяснить, как решить вопрос, или предложить альтернативы для снятия информации

Дополнительные указания

Скрывать данные заказчика (названия фирм, телефоны, Email, ссылки на внешние ресурсы). Учитывать только публично доступную информацию, доступную без входа на сайт.