Техническое задание: Коррекция дефектов печати в документах
Необходимо разработать решение на Python для обработки сканированных документов строгой отчётности. Основная проблема - смещение печати, из-за которого вводимые данные (цифры, значения) наезжают на статический текст бланка (заголовки полей).
Основная задача
Создать скрипт, который выполняет следующие действия:
- Детекция областей: Автоматическое определение зон с переменными данными и статическими заголовками на изображении документа (Object Detection).
- Анализ пересечений: Выявление фактов геометрического наложения/пересечения этих областей.
- Коррекция дефекта: Программное исправление наложения путём сдвига напечатанного значения на свободное место в документе.
Ключевое требование (Hard Skill)
Запрещено использовать подход с распознаванием текста (OCR) и последующей перепечаткой стандартным шрифтом. Это нарушает визуальную аутентичность и оригинальность документа. Необходимо работать непосредственно с изображением.
Технический стек
- Язык программирования: Python
- Основные библиотеки: OpenCV, NumPy
- Для детекции объектов: YOLO или аналогичные современные фреймворки.
Вопрос для обсуждения
В отклике важно описать ваш подход к отделению текста от фона (подложки) в случаях их пересечения, без использования генерации шрифта. Примеры документов и детали будут предоставлены дополнительно.