Техническое задание: Парсинг Web Archive и импорт в DLE

Необходимо создать автоматизированное решение для извлечения контента с архивных версий веб-сайтов и его загрузки в систему DLE (DataLife Engine).

Основные требования

  • Разработка парсера для работы с сервисом Web Archive (archive.org).
  • Обеспечение корректного сбора данных (текст, изображения, мета-информация) с архивных снимков сайтов.
  • Создание модуля для импорта собранных данных в CMS DLE с сохранением структуры и форматов.
  • Решение должно быть надежным и обрабатывать возможные ошибки при работе с архивом.

Дополнительная информация

Для полного понимания задачи и процесса, заказчик предоставил подробную видео-инструкцию длительностью 8 минут, где наглядно показан желаемый результат и ключевые этапы работы. Все технические нюансы обсуждаются с исполнителем после отклика.

Цель проекта

Автоматизация процесса восстановления или переноса контента с устаревших или измененных версий сайтов в действующую систему управления.