Общее описание задачи

Требуется разработать программу-парсер, которая последовательно обрабатывает все страницы веб-справочника, ориентируясь по боковому меню. Итогом работы должен стать набор PDF-файлов, содержащих полный текст документации (со всеми раскрытыми вкладками и разделами).

Детальные требования к функционалу

1. Парсинг меню

  • Программа должна проходить по всем пунктам левого бокового меню сайта.
  • У каждого пункта меню необходимо извлечь текст ссылки (кнопки/анкора).
  • Полученный текст будет использован для именования итогового файла.

2. Работа с содержимым страниц

  • Программа должна переходить по каждой ссылке из меню.
  • На страницах могут находиться сворачивающиеся блоки (аккордеоны, спойлеры). Перед созданием PDF необходимо программно (через эмуляцию клика или через JavaScript) раскрыть все скрытые элементы, чтобы в итоговый документ попал абсолютно весь текст.

3. Формирование итогового файла

  • Каждую полностью загруженную и подготовленную страницу сохранить в формат PDF.
  • Имена файлов должны строго соответствовать маске: N. Текст пункта меню.pdf (без квадратных скобок).
  • Нумерация (N) начинается с 1 и увеличивается на 1 для каждого последующего нового пункта меню.

Примеры имен файлов

  • 1. Введение в программирование.pdf
  • 2. Основные алгоритмы.pdf
  • 3. Структуры данных.pdf