Задача

Требуется доработать сервис автоматической обработки документов DOCX на связке Google Apps Script + Cloud Run (Python). В системе предусмотрено 10 профилей обработки, каждый из которых имеет два этапа.

Общая схема работы

  • Документ приходит на почту или в папку; профиль выбирается по метке или параметру
  • Apps Script принимает файл и передаёт его в Cloud Run
  • Cloud Run выполняет обработку DOCX и возвращает готовый файл
  • Результат отправляется пользователю обратно

Этап 1 (общий для всех 10 профилей)

Очистка текста от технических артефактов: лишние пробелы, переносы, «битые» символы, смешанные пробелы и табуляции

Этап 2 (индивидуальный для каждого профиля)

Для каждого профиля применяется свой набор правил «второго уровня»:

  • точечные текстовые эффекты и оформление отдельных фрагментов
  • специализированные преобразования элементов документа по заданным правилам
  • обработка по справочнику/шаблону (нормализация терминов и вариантов написания)

Дополнительно (опционально)

Подключение оплаты по платёжной ссылке и статусы заказа: ожидает оплату → оплачено → в обработке → готово.

Что предоставим

Готов предоставить примеры документов, эталонные результаты (как должно выглядеть «после») и текущую архитектуру системы.

Разработка интернет-магазина каталога для промышленных комплектующих

Требуется создать полнофункциональный интернет-магазин с каталогом товаров, системой фильтрации и административной панелью для самостоятельного управления контентом. Проект включает блок с информацией о компании и контактами.