Техническое задание: Парсинг контактных данных
Цель проекта
Необходимо автоматизировать сбор публичных контактных данных компаний из открытого источника. Исходные данные включают список организаций и ссылки на их официальные сайты.
Требования к результату
Итоговые данные должны быть представлены в файле формата Excel (.xlsx) со следующими колонками:
- Название компании (как в исходном списке)
- Официальное наименование (полное юридическое название)
- Идентификационный номер налогоплательщика (ИНН)
- Адрес официального сайта
- Контактный телефон
- Адрес электронной почты (email)
Что необходимо сделать
- Разработать скрипт или программу для автоматического обхода списка сайтов.
- На каждом сайте определить и извлечь указанные контактные данные (телефон, email, ИНН, официальное название).
- Обеспечить валидацию и очистку извлеченных данных.
- Структурировать информацию и сохранить в Excel-файл.
Дополнительные условия
Исполнителю необходимо оценить объем работы, сроки выполнения и стоимость проекта. В ответе ожидается подробное коммерческое предложение с описанием подхода к решению задачи.