Техническое задание: Извлечение и конвертация текста из PDF

Суть проекта

Необходимо обработать партию из более чем 100 PDF-документов. Часть документов является отсканированными, часть - структурированными электронными файлами. Основная цель - аккуратно извлечь простой английский текст и перенести его в файлы Microsoft Office, строго соблюдая структуру и содержание исходников.

Требования к результату

  • Формат файлов: Основной массив документов должен быть преобразован в формат Microsoft Word (.docx).
  • Для табличных данных: Небольшая часть документов, исходя из их содержания, должна быть перенесена в файлы Microsoft Excel (.xlsx).
  • Качество: К работе требуется максимальная внимательность и точность. Извлечённый текст должен полностью соответствовать оригиналу по структуре, последовательности и содержанию.
  • Сдача работы: Готовые файлы в форматах .docx и .xlsx. По умолчанию ожидается один файл на один исходный документ, но этот пункт может быть согласован дополнительно.

Условия и сроки

  • Срок выполнения работы: от 3 до 5 дней.
  • Исполнитель должен оперативно отвечать на сообщения и быть готовым начать работу сразу после подтверждения заказа.
  • Примеры выполненных работ и дополнительная информация об опыте исполнителя будут предоставлены по запросу.

Разработка интеллектуальной поисковой системы и AI-бота для промышленного каталога

Требуется комплексная модернизация сайта с внедрением умного поиска на Elasticsearch, AI-чатом для подбора оборудования и интеграцией с CRM. Необходимо реализовать семантический поиск, обработку естественного языка и автоматизацию лидов.

Разработка системы мгновенного отслеживания новых товаров с Telegram-ботом

Требуется создать парсер для мониторинга появления новых товаров на маркетплейсе и полноценного Telegram-бота с индивидуальными настройками для каждого пользователя. Исполнители, предлагающие использование ИИ-кодеров, не рассматриваются.