Техническое задание: Парсинг данных с сайта патентов

Необходимо автоматизировать сбор информации с веб-ресурса, содержащего базу патентных документов.

Основные требования

  • Объект парсинга: сайт с патентной документацией (структура страниц аналогична примеру).
  • Объем работы: необходимо обработать примерно 3000 отдельных страниц.
  • Результат: собранные структурированные данные со всех целевых страниц.
  • Каждая страница должна быть обработана полностью, извлечена вся представленная на ней информация.

Ожидаемый результат

На выходе должен быть получен полный датасет, соответствующий объему в 3000 документов, готовый для дальнейшего анализа или использования.