Техническое задание: Парсинг контактов с веб-сайта
Цель проекта
Автоматизировать сбор и структурирование контактной информации с указанного веб-ресурса. Результатом должна стать готовая к использованию таблица данных.
Основные задачи
- Разработать скрипт для обхода страниц целевого сайта.
- Извлечь не менее 50 000 email-адресов (Gmail).
- Для каждого адреса собрать и сопоставить связанные данные: название компании и номер телефона.
- Структурировать полученные данные в единую таблицу (например, CSV или Excel).
- Обеспечить корректную обработку пагинации на сайте.
Требования к результату
- Финальный файл в табличном формате с колонками: "Название компании", "Телефон", "Email".
- Данные должны быть чистыми и проверенными на валидность (особенно email-адреса).
- Процесс сбора должен быть автоматизирован для работы с большим объемом страниц.
Технические примечания
Исполнителю будет предоставлен точный URL целевого ресурса для начала работы. Важно учитывать структуру сайта и возможные ограничения на частоту запросов.