О проекте

Мы автоматизируем сбор данных с сайтов партнёров. Система уже включает два рабочих парсера, и теперь требуется разработать третий - для нового источника.

Задачи разработчика

  • Спроектировать и написать парсер на Python;
  • Обеспечить парсинг структурированных данных (JSON/xml/HTML);
  • Интегрировать модуль с существующей системой;
  • Покрыть код тестами (unittest/pytest);
  • Реализовать обработку ошибок и повторные попытки;
  • Оптимизировать производительность всей цепочки.

Требования к исполнителю

  • Уверенное владение Python (3.8+);
  • Опыт с парсингом: requests, BeautifulSoup, Scrapy (или аналогами);
  • Умение работать с регулярными выражениями и XPath;
  • Понимание работы с динамически загружаемым контентом (Selenium, Playwright);
  • Опыт написания unit-тестов;
  • Git, CI/CD, базовая настройка окружения.

Формат работы

Удалённо, полная занятость на период разработки - 1-2 недели. Код сдается в репозиторий GitHub/GitLab с документацией.

Запуск и настройка аккаунта на Avito для оптовых продаж

Требуется заполнить и запустить аккаунт на площадке Avito для оптовой торговли продуктами питания. Регион работы - вся Россия, логистика собственная. Пишите предложения и цены, мы только начинаем осваивать этот канал.

Разработка модуля парсинга данных с сайта

Требуется универсальный автономный парсер для сбора и отслеживания изменений на сайте, с передачей данных в агрегатор через RabbitMQ. Модуль должен автоматически обходить защиту от ботов и быть готовым к сбору любых категорий без написания нового кода.