Задача
Требуется доработать сервис автоматической обработки документов DOCX на связке Google Apps Script + Cloud Run (Python). В системе предусмотрено 10 профилей обработки, каждый из которых имеет два этапа.
Общая схема работы
- Документ приходит на почту или в папку; профиль выбирается по метке или параметру
- Apps Script принимает файл и передаёт его в Cloud Run
- Cloud Run выполняет обработку DOCX и возвращает готовый файл
- Результат отправляется пользователю обратно
Этап 1 (общий для всех 10 профилей)
Очистка текста от технических артефактов: лишние пробелы, переносы, «битые» символы, смешанные пробелы и табуляции
Этап 2 (индивидуальный для каждого профиля)
Для каждого профиля применяется свой набор правил «второго уровня»:
- точечные текстовые эффекты и оформление отдельных фрагментов
- специализированные преобразования элементов документа по заданным правилам
- обработка по справочнику/шаблону (нормализация терминов и вариантов написания)
Дополнительно (опционально)
Подключение оплаты по платёжной ссылке и статусы заказа: ожидает оплату → оплачено → в обработке → готово.
Что предоставим
Готов предоставить примеры документов, эталонные результаты (как должно выглядеть «после») и текущую архитектуру системы.