Техническое задание: Парсинг каталога сайта

Суть проекта

Необходимо разработать скрипт для сбора данных из каталога товаров на крупном корпоративном сайте. Каталог имеет многоуровневую структуру (разделы, подразделы, категории).

Основные задачи

  • Обход всех разделов и подразделов каталога.
  • Сбор данных о товарах (название, артикул, характеристики, описание, изображения и т.д.).
  • Структурирование данных в удобном формате (например, CSV, JSON, Excel).
  • Обеспечение стабильности работы парсера и обработка ошибок.

Требования к исполнителю

  • Опыт парсинга сложных сайтов с JavaScript-рендерингом.
  • Умение обходить антибот-защиту (при необходимости).
  • Понимание структуры данных и умение работать с древовидными каталогами.
  • Предоставление чистого, читаемого кода с комментариями.

Что нужно предоставить по итогу

  • Рабочий скрипт для парсинга.
  • Собранную и структурированную базу данных.
  • Краткую документацию по запуску.