Задача

Требуется очистить Excel-файл от дублирующихся значений и нормализовать формат номеров. Исходный файл содержит около 40 000 строк, из которых примерно 6 000 являются дубликатами. Дубли выделены красным цветом.

Требования к обработке

  • Удаление дубликатов: убрать все повторяющиеся значения полностью - как оригиналы, так и дубликаты.
  • Приведение к формату: все значения должны состоять из 11 цифр, начинающихся с 7 (формат: 79000000000). Номера короче 7 символов следует дополнить цифрой 7 в начале. Если значение не подходит под итоговый формат после всех преобразований - удалить его.

Дополнительно

  • Итоговый файл должен содержать только уникальные и корректные номера, отсортированные в произвольном порядке.
  • Конфиденциальность: все упоминания названий фирм, сайтов или телефонов ООО/ОАО заменены на общие обозначения.