Техническое задание: Парсинг доменных имен
Цель проекта
Создать инструмент для автоматического извлечения списка доменов (веб-сайтов) организаций, представленных на определенной странице онлайн-справочника.
Источник данных
Целевой адрес: formed.by/index.php?classifiers_org
Что необходимо сделать
- Проанализировать структуру указанной веб-страницы.
- Найти в ее исходном HTML-коде блоки с наименованием "Информация об организации".
- Извлечь из этих блоков все доменные имена (URL веб-сайтов компаний).
- Обеспечить корректную обработку и очистку данных.
- Подготовить итоговый список доменов в удобном для использования виде.
Требования к результату
- Скрипт должен возвращать чистый список извлеченных доменов.
- Все контактные данные организаций (названия фирм, телефоны), кроме доменов, должны быть проигнорированы или удалены из вывода.
- Работа скрипта должна быть стабильной и учитывать возможные изменения в структуре страницы.
Дополнительные указания
Исполнителю необходимо предложить оптимальную технологию для реализации (например, Python с библиотеками requests и BeautifulSoup) и обеспечить ясность кода для возможной дальнейшей поддержки.