Краткое описание задачи
Необходимо создать инструмент или модуль, который в процессе парсинга веб-страниц загружает изображения и программно удаляет с них водяные знаки. Решение должно быть эффективным, точным и сохранять максимальное качество исходного изображения.
Основные требования
Парсинг изображений: получение графических файлов с целевого ресурса с сохранением их URL и метаданных.
Удаление водяных знаков: применение алгоритмов inpainting, клонирования пикселей или нейросетевых методов для замещения текста, логотипов или графических overlay.
Неразрушающая обработка: важно минимизировать артефакты и максимально сохранить оригинальный контент под водяным знаком.
Пакетная обработка: возможность обрабатывать тысячи изображений за минимальное время.
API/интеграция: простой вызов функции или REST-сервис для использования в существующем пайплайне парсинга.
Технические детали
Поддерживаемые форматы: JPEG, PNG, WEBP, TIFF (на выходе рекомендуется PNG без альфа-канала или высокое качество JPEG).
Типы водяных знаков: полупрозрачные строки, статические логотипы, паттерны в углах.
Точность: допускается не более 5-7% площади с заметным шумом по сравнению с областью без водяного знака.
Дополнительно
Желательно предоставить примеры обработанных изображений до/после.
Наличие простого скрипта не требуется, но документации к полученному решению - обязательно.
Работа должна быть сдана в виде архива с исходным кодом на Python, инструкцией по установке зависимостей (requirements.txt) и примером использования.