Техническое задание: Извлечение веб-контента из архива
Основная цель - получить дизайн и контент сайта в виде готовой HTML-структуры для дальнейшего анализа или использования.
Основные задачи
- Найти и загрузить сохраненную версию указанного сайта из веб-архива за 26 февраля 2021 года.
- Извлечь полную HTML-разметку страницы в том виде, в котором она была сохранена.
- Сохранить все текстовые материалы, присутствующие на странице.
- При возможности, сохранить медиафайлы (изображения, CSS, скрипты), доступные в архиве.
Требования к результату
- Не требуется развертывание (натягивание) сайта на хостинге или установка CMS.
- Финальный результат - это файлы (HTML, изображения, стили), полностью отражающие состояние сайта на указанную дату.
- Важно обеспечить целостность структуры и корректность извлеченных данных.
Что не входит в задачу
- Адаптация дизайна под современные стандарты.
- Исправление битых ссылок или ошибок в исходном коде.
- Доработка функционала сайта.