Задача: Верификация и поиск сайтов компаний
Исходные данные
Имеются два файла (во вложении), каждый из которых содержит список примерно из 500 организаций. Все доступные сведения ограничены данными внутри этих документов. Названия компаний заменены на обобщенные идентификаторы для безопасности данных в этом ТЗ.
Что необходимо сделать
- Для каждой организации из списка найти действующий официальный веб-сайт.
- Если сайт существует - зафиксировать полный URL.
- Если официального сайта у компании нет - пометить соответствующую позицию как 'Сайт не найден/отсутствует'.
Формат результата
Результаты работы необходимо предоставить в формате JSON, где для каждой записи указан идентификатор компании и итог поиска (URL или статус).
Условия анализа:
Дополнительной информации, кроме предоставленных файлов, у заказчика нет. Путь к файлам и места хранения были заменены для конфиденциальности. На первом этапе подразумевается, что сайты могут отсутствовать у значительной части списка, поэтому важна точность проверки для каждой записи.