Задача: Парсинг 30 ссылок на стороннем ресурсе

Цель работы

Получить 30 рабочих ссылок (каждый URL будет отправлен исполнителю) и по каждой собрать содержимое тега <body> в отдельный HTML-файл. Никаких внешних стилей/скриптов.

Первый этап

  • На первом этапе собираем 30-30.000 ссылок строго с предоставленного заказчиком сайта (ссылку передам лично)
  • После этого исполнитель спарсит содержимое <body> для каждой ссылки и сохранит отдельно

Технические требования

  • Результат - файлы *n*.html, где n - порядковый или id-номер ссылки
  • В каждом внутри именно то, что находится внутри <body>, без самого тега <body>, без стилей, без скриптов
  • Язык реализации - Python. Разрешены любые стандартные или популярные библиотеки

Что будет запущено

  • У меня нет опыта в парсинге - нельзя давать сложные объяснения, только готовый код с комментариями
  • После сбора необходимо: заказчик проверяет качество (браузер и структура тегов), принимаю-проверяю на первый этап

Оплата и сроки

  • Первый (сбор ссылок) - обсуждаем сразу после вывода на этот заказ
  • Второй этап обговариваем отдельно после сдачи первого этапа)