Техническое задание: Очистка базы email-адресов от проблемных записей
Контекст задачи
Имеется база данных электронных адресов, которая прошла первичную проверку валидности через SMTP-сервис. Однако после этой проверки в базе остаётся категория так называемых "проблемных адресов", которые требуют дополнительной фильтрации.
Цель проекта
Разработать и внедрить механизм для автоматического выявления и исключения проблемных email-адресов из существующей базы данных заказчика.
Примеры проблемных адресов (для понимания паттернов)
- sch58@yandex.ru
- prirechniy@yandex.ru
- tarmuk@yandex.ru
- centr@yandex.ru
Основные требования к решению
- Проанализировать предоставленные примеры проблемных адресов для выявления общих характеристик или паттернов.
- Создать алгоритм или набор правил для автоматического обнаружения подобных адресов в базе.
- Разработать скрипт или программу, которая выполнит фильтрацию и создаст очищенную версию базы данных.
- Решение должно быть масштабируемым и применимым ко всей базе, а не только к приведённым примерам.
- Предоставить отчёт или логи о количестве и типах исключённых адресов.
Ожидаемый результат
Очищенная база email-адресов, из которой удалены проблемные записи, идентифицированные по заданным критериям. Готовое решение для повторного применения при необходимости.