Цель проекта
Разработать программу (парсер), которая собирает перечень компаний-участниц специализированных выставок и извлекает контактные данные из каждой карточки.
Исходные данные
- Тип источника: сайт онлайн-каталога участников мероприятия (HTML-страницы).
- Данные выводятся списком, для каждой компании доступна подробная карточка.
- В карточке присутствуют: наименование компании, страна, телефон, email, адрес веб-сайта.
Требования к результату
- Запуск и настройка: желательно указать конкретный URL страницы со списком компаний.
- Обход списка: программа должна рекурсивно открывать все карточки из него.
- Извлечение полей: название компании, страна производства/регистрации, контактный телефон, электронная почта, веб-сайт.
- Формат выдачи: готовый структурированный файл или возможность записи в базу данных (уточнить с исполнителем). Логичным форматом считается CSV, JSON или Excel.
- Качество данных: на выходе необходимо исключить дубликаты и наименования самих площадок/интеграторов.
Пример страницы для старта работы
Предоставляется по запросу или при детальном уточнении клиентом: ссылка на онлайн-библиотеку экспонентов с фильтром конкретной страны.