Техническое задание: Извлечение и конвертация текста из PDF
Суть проекта
Необходимо обработать партию из более чем 100 PDF-документов. Часть документов является отсканированными, часть - структурированными электронными файлами. Основная цель - аккуратно извлечь простой английский текст и перенести его в файлы Microsoft Office, строго соблюдая структуру и содержание исходников.
Требования к результату
- Формат файлов: Основной массив документов должен быть преобразован в формат Microsoft Word (.docx).
- Для табличных данных: Небольшая часть документов, исходя из их содержания, должна быть перенесена в файлы Microsoft Excel (.xlsx).
- Качество: К работе требуется максимальная внимательность и точность. Извлечённый текст должен полностью соответствовать оригиналу по структуре, последовательности и содержанию.
- Сдача работы: Готовые файлы в форматах .docx и .xlsx. По умолчанию ожидается один файл на один исходный документ, но этот пункт может быть согласован дополнительно.
Условия и сроки
- Срок выполнения работы: от 3 до 5 дней.
- Исполнитель должен оперативно отвечать на сообщения и быть готовым начать работу сразу после подтверждения заказа.
- Примеры выполненных работ и дополнительная информация об опыте исполнителя будут предоставлены по запросу.