Техническое задание: Улучшение сервиса распознавания документов (OCR)

Цель проекта

Требуется доработка существующего программного обеспечения для оптического распознавания текста (OCR) с целью радикального повышения его точности на нешаблонных документах.

Текущая ситуация

  • Имеется разработанный сервис, выполняющий распознавание сканированных документов.
  • Текущая точность (accuracy) распознавания текста составляет примерно 75%.
  • Документы не имеют строгого шаблона, что усложняет задачу.
  • Исходный код проекта будет предоставлен исполнителю.

Основные задачи для исполнителя

  1. Развертывание тестового окружения: Создание рабочего стенда для запуска и тестирования текущей версии сервиса.
  2. Совместный прогон тестов: Проведение тестирования на предоставленном наборе документов для оценки текущих результатов.
  3. Анализ и доработка: Выявление причин ошибок и реализация улучшений в алгоритмах предобработки изображений, сегментации текста или непосредственно распознавания.

Ключевое требование к результату

Целевой показатель точности распознавания текста после доработок должен быть повышен до 95% и выше на тестовой выборке документов.

Ожидаемый результат сотрудничества

  • Рабочее тестовое окружение с обновленным сервисом OCR.
  • Подтвержденный метриками рост точности распознавания.
  • Готовность системы к интеграции или дальнейшему развитию.

Разработка двух интерактивных калькуляторов стоимости

Требуется создать два онлайн-калькулятора для сайта архитектурно-дизайнерской студии: для расчёта стоимости строительства дома и дизайна интерьера. Калькуляторы должны быть интерактивными и удобными для пользователей.