Техническое задание: Диагностика и решение проблем веб-скрапинга

Возникла проблема с парсингом данных с одного конкретного веб-сайта. Стандартный инструмент для проверки (чекер) возвращает ошибку или не начинает сканирование при указании его URL. При этом с другими сайтами аналогичный процесс работает корректно, что указывает на наличие специальных механизмов защиты на целевом ресурсе.

Цели работы

  • Проанализировать, какие технологии или методы защиты (например, JavaScript-проверки, капча, анализ заголовков, WAF) использует проблемный сайт.
  • Определить точную причину, по которой стандартный краулер не может получить доступ к содержимому.
  • Предложить и, по возможности, реализовать или описать рабочие методы обхода этой защиты для успешного сбора данных.
  • Объяснить принципы работы таких систем защиты и научить стратегиям их преодоления в будущем.

Требования к решению

  • Решение должно быть практическим и применимым для дальнейшего использования.
  • Объяснения должны быть четкими и понятными для человека, столкнувшегося с подобной проблемой.
  • Важно сосредоточиться на методах, а не на использовании конкретных коммерческих сервисов или названий ПО.

Разработка инструмента для автоматической векторизации растровых изображений

Требуется создать программу для конвертации растровых изображений (PNG, JPG) в векторный формат с функцией автоматической трассировки и возможностью утончения линий. Решение должно быть в виде скрипта или приложения.

Наполнение карточек товаров для интернет-магазина

Требуется специалист для заполнения и оформления карточек товаров (100 позиций) в админке интернет-магазина. Работа включает редактирование названий, описаний, загрузку и обработку изображений. Необходима стабильность и внимательность к деталям.