Техническое задание: Парсинг контактов с веб-сайта

Цель проекта

Автоматизировать сбор и структурирование контактной информации с указанного веб-ресурса. Результатом должна стать готовая к использованию таблица данных.

Основные задачи

  • Разработать скрипт для обхода страниц целевого сайта.
  • Извлечь не менее 50 000 email-адресов (Gmail).
  • Для каждого адреса собрать и сопоставить связанные данные: название компании и номер телефона.
  • Структурировать полученные данные в единую таблицу (например, CSV или Excel).
  • Обеспечить корректную обработку пагинации на сайте.

Требования к результату

  • Финальный файл в табличном формате с колонками: "Название компании", "Телефон", "Email".
  • Данные должны быть чистыми и проверенными на валидность (особенно email-адреса).
  • Процесс сбора должен быть автоматизирован для работы с большим объемом страниц.

Технические примечания

Исполнителю будет предоставлен точный URL целевого ресурса для начала работы. Важно учитывать структуру сайта и возможные ограничения на частоту запросов.