Техническое задание: Конвертация PDF-каталогов в Google Таблицы
Цель проекта
Автоматизировать процесс извлечения структурированных данных из электронных каталогов в формате PDF и их организацию в Google Таблицы для удобного анализа и работы.
Основные требования
- Исходные данные: электронные каталоги в формате PDF (образец доступен по ссылке).
- Результат: данные должны быть размещены в Google Таблице.
- Структура результата:
- Каждый исходный PDF-файл преобразуется в отдельный лист внутри Google Таблицы.
- Название листа должно соответствовать имени исходного PDF-файла.
- Столбцы в таблице должны включать (при наличии в исходнике):
- Артикул
- Изображение товара (картинка)
- Цена
- Необходимо корректно распознать и перенести данные, сохранив их целостность.
Технические детали
Исполнителю необходимо предложить оптимальный метод решения (например, использование скриптов, специализированных инструментов или сервисов парсинга) для точного извлечения текстовых и графических данных из PDF и их последующего форматирования в таблицу.