Техническое задание: Парсинг данных интернет-магазина
Основная цель
Автоматизировать сбор исчерпывающей информации по каждому товару с целевого сайта и представить данные в удобном формате Excel.
Требования к собираемым данным
Для каждой карточки товара необходимо извлечь следующую информацию:
- Основные данные: наименование товара, артикул, стоимость.
- Наличие: информация о наличии на складе.
- Контент: краткое и полное описание, характеристики, инструкции.
- Медиафайлы: все фотографии товара, видео (при наличии).
- Условия: информация о гарантии, возврате, оплате и доставке.
- Связи: блоки "Похожие товары" и другие разделы с рекомендациями - со сбором всех ссылок на связанные товары.
Формат результата
Все собранные данные должны быть структурированы и выгружены в единый файл формата Microsoft Excel (.xlsx). Каждый товар - отдельная строка с четко обозначенными колонками для каждого типа информации. Ссылки на медиафайлы должны быть активными.
Ключевые требования
- Парсинг должен быть глубоким и охватывать все страницы товаров.
- Скрипт должен корректно обрабатывать динамический контент (если присутствует).
- Важно обеспечить стабильность работы и обработку возможных ошибок (отсутствие некоторых блоков на странице).
- Исходный код решения должен быть передан заказчику.