Техническое задание: Преобразование PDF в редактируемый документ Word
Суть задачи
Имеются два нередактируемых PDF-файла (отсканированные инструкции). Требуется вручную или с помощью инструментов распознавания (OCR) точно перенести весь текстовый контент и табличные данные в новый документ Microsoft Word.
Требования к результату
- Формат: Файл Microsoft Word (.docx).
- Контент: Весь текст и все таблицы из исходных PDF-файлов.
- Качество: Текст и таблицы должны быть полностью редактируемыми (не картинками).
- Исключение: Графические изображения, схемы или логотипы могут быть оставлены в виде вставленных картинок.
- Язык: Исходный текст на английском языке должен быть сохранен без искажений.
Критерии приемки
- Полное соответствие содержимого исходным PDF-файлам.
- Сохранение логической структуры документа (заголовки, списки, таблицы).
- Отсутствие опечаток и ошибок распознавания.
- Чистый, готовый к дальнейшему использованию Word-документ.