Техническое задание: Устранение скрытых дублей товаров в Host CMS
Суть проблемы
После массовой загрузки товаров на сайт через файл Excel в системе управления Host CMS возникла критическая ошибка:
- На сайте создалось множество дублирующихся страниц товаров.
- Эти страницы-дубли возвращают статус 404 (страница не найдена).
- В административной панели Host CMS данные дубликаты не отображаются, управлять ими стандартными средствами невозможно.
- При этом внутренний поиск по сайту находит и показывает эти несуществующие страницы, что вводит в заблуждение пользователей и ухудшает качество сайта.
Задачи для исполнителя
- Анализ и диагностика: Определить источник проблемы и механизм создания скрытых дублей в базе данных или файловой системе.
- Очистка базы данных: Найти и безопасно удалить все записи, соответствующие дублирующимся товарам, которые не отображаются в админке.
- Очистка поискового индекса: Удалить упоминания несуществующих страниц из системы внутреннего поиска сайта.
- Восстановление корректной работы: Убедиться, что после устранения дублей все оригинальные товары отображаются корректно, а ошибки 404 исчезли.
- Рекомендации: Предоставить рекомендации по настройке будущих импортов через Excel, чтобы избежать повторения проблемы.
Требования к решению
- Работа должна быть выполнена аккуратно, без риска потери оригинальных данных.
- Необходимо понимание архитектуры CMS Host CMS и структуры её базы данных.
- Желателен опыт решения подобных проблем, связанных с некорректным импортом данных.