Описание задачи

Необходимо выполнить распознавание текста (OCR) или ручную перепечатку отсканированных страниц книги, предоставленных в графическом формате JPG, и сохранить полученный текст в формат документа Word (DOCX).

Основные требования

  • Перенести текст из всех предоставленных JPG-файлов в один итоговый документ Word.
  • Максимально точно сохранить оригинальный шрифт, размер заголовков и расположение текста.
  • Устранить возможные ошибки распознавания (опечатки, лишние символы).
  • Обработать все страницы книги от первой до последней.
  • Сохранить итоговый файл в формате .docx доступном для редактирования.

Входные данные

Набор изображений высокого качества, которые необходимо показать исполнителю для оценки объема работы перед началом. Точное количество страниц и сложность шрифтов уточняются в диалоге с заказчиком.

Настройка Capture One для оцифровки книг под OCR

Ищу специалиста по Capture One с опытом пакетной обработки фото страниц книг. Необходимо настроить профиль для конвертации RAW в TIFF, оптимизированный для программ ScanTailor и ABBYY FineReader, без художественной ретуши, только техническое качество для распознавания текста.