Техническое задание: Преобразование PDF в редактируемый документ Word

Суть задачи

Имеются два нередактируемых PDF-файла (отсканированные инструкции). Требуется вручную или с помощью инструментов распознавания (OCR) точно перенести весь текстовый контент и табличные данные в новый документ Microsoft Word.

Требования к результату

  • Формат: Файл Microsoft Word (.docx).
  • Контент: Весь текст и все таблицы из исходных PDF-файлов.
  • Качество: Текст и таблицы должны быть полностью редактируемыми (не картинками).
  • Исключение: Графические изображения, схемы или логотипы могут быть оставлены в виде вставленных картинок.
  • Язык: Исходный текст на английском языке должен быть сохранен без искажений.

Критерии приемки

  • Полное соответствие содержимого исходным PDF-файлам.
  • Сохранение логической структуры документа (заголовки, списки, таблицы).
  • Отсутствие опечаток и ошибок распознавания.
  • Чистый, готовый к дальнейшему использованию Word-документ.