Разработка парсера для автомобильного портала
Необходимо создать программное решение для автоматического сбора структурированных данных с крупного сайта по продаже автомобилей.
Основные цели проекта
- Сбор полных данных по выбранным категориям объявлений.
- Обеспечение стабильной работы и обхода возможных ограничений сайта.
- Предоставление данных в удобном для анализа формате.
Требования к данным
В выгрузке должны присутствовать все доступные поля из объявлений. Особое внимание уделяется следующим обязательным пунктам:
- Номера телефонов продавцов.
- Цены (включая расчет средних значений по категориям).
- Прямые ссылки на фотографии автомобилей.
- Полная техническая и контактная информация.
Формат результата
- Предпочтительный выходной формат: CSV или JSON.
- Данные должны быть чистыми, структурированными и готовыми к импорту в базы данных или аналитические системы.
- В идеале - создание простого API для выполнения запросов и получения выгрузок.
Технические пожелания
- Решение должно быть надежным и эффективным.
- Желательна возможность гибкой настройки категорий для парсинга.
- Код должен быть хорошо документирован.