Техническое задание: Сбор контента
Основная задача
Требуется собрать графический и текстовый контент, посвящённый коллекциям тканей, с трёх веб-сайтов поставщиков. Работа включает обработку данных в разных форматах организации информации.
Объём работ
- Обработка трёх сайтов с различной структурой представления данных.
- Сбор контента по ~50 целевым коллекциям (точные ссылки будут предоставлены в полном ТЗ).
- Общее количество графических файлов - более 700 единиц.
- Извлечение сопутствующей текстовой информации с сохранением в формате TXT.
Требования к обработке для разных типов сайтов
Тип 1
- Сбор изображений коллекций без переименования файлов.
- Дополнительная загрузка промо-PDF для каждой коллекции.
Тип 2
- Сбор изображений с обязательным переименованием файлов согласно названиям, указанным в коллекциях.
- Извлечение дополнительной текстовой информации из вкладок на страницах коллекций.
Тип 3
- Сбор изображений с переименованием файлов по названию коллекции.
- Сбор дополнительной текстовой информации в виде простого текста.
Результат работы
Полный пакет собранных графических материалов (700+ файлов) и текстовых описаний в удобной для дальнейшего использования структуре. Все детали, ссылки на коллекции и пояснения будут переданы исполнителю после согласования.