Техническое задание: Парсинг мета-заголовков сайтов
Суть задачи
Имеется электронная таблица (например, Excel или Google Sheets), в которой в колонке A расположено 800 URL-адресов различных сайтов. Необходимо автоматически получить для каждого сайта содержимое HTML-тега
и записать результат в соответствующую строку колонки B.Требования к реализации
- Скрипт или программа должны обрабатывать список из 800 URL.
- Для каждого URL необходимо загрузить веб-страницу и извлечь текст между тегами и .
- Извлеченные заголовки должны быть записаны в таблицу, в колонку B, напротив исходного URL.
- Важно предусмотреть обработку ошибок (недоступные сайты, отсутствие тега title, таймауты).
Ожидаемый результат
Заполненная таблица, где в колонке A - исходный URL, а в колонке B - соответствующий ему заголовок страницы (title).