Техническое задание: Парсинг Web Archive и импорт в DLE
Необходимо создать автоматизированное решение для извлечения контента с архивных версий веб-сайтов и его загрузки в систему DLE (DataLife Engine).
Основные требования
- Разработка парсера для работы с сервисом Web Archive (archive.org).
- Обеспечение корректного сбора данных (текст, изображения, мета-информация) с архивных снимков сайтов.
- Создание модуля для импорта собранных данных в CMS DLE с сохранением структуры и форматов.
- Решение должно быть надежным и обрабатывать возможные ошибки при работе с архивом.
Дополнительная информация
Для полного понимания задачи и процесса, заказчик предоставил подробную видео-инструкцию длительностью 8 минут, где наглядно показан желаемый результат и ключевые этапы работы. Все технические нюансы обсуждаются с исполнителем после отклика.
Цель проекта
Автоматизация процесса восстановления или переноса контента с устаревших или измененных версий сайтов в действующую систему управления.