Техническое задание: Улучшение сервиса распознавания документов (OCR)
Цель проекта
Требуется доработка существующего программного обеспечения для оптического распознавания текста (OCR) с целью радикального повышения его точности на нешаблонных документах.
Текущая ситуация
- Имеется разработанный сервис, выполняющий распознавание сканированных документов.
- Текущая точность (accuracy) распознавания текста составляет примерно 75%.
- Документы не имеют строгого шаблона, что усложняет задачу.
- Исходный код проекта будет предоставлен исполнителю.
Основные задачи для исполнителя
- Развертывание тестового окружения: Создание рабочего стенда для запуска и тестирования текущей версии сервиса.
- Совместный прогон тестов: Проведение тестирования на предоставленном наборе документов для оценки текущих результатов.
- Анализ и доработка: Выявление причин ошибок и реализация улучшений в алгоритмах предобработки изображений, сегментации текста или непосредственно распознавания.
Ключевое требование к результату
Целевой показатель точности распознавания текста после доработок должен быть повышен до 95% и выше на тестовой выборке документов.
Ожидаемый результат сотрудничества
- Рабочее тестовое окружение с обновленным сервисом OCR.
- Подтвержденный метриками рост точности распознавания.
- Готовность системы к интеграции или дальнейшему развитию.