Техническое задание: Автоматизация обработки и выгрузки данных

Цель проекта

Создать автоматизированное решение для извлечения, обработки и загрузки большого объема структурированных данных из книг продаж в формате Excel в два целевых веб-сервиса.

Исходные данные

  • Формат: Файлы Microsoft Excel (36-40 файлов).
  • Содержимое: Каждый файл представляет собой книгу продаж с большим массивом записей.
  • Ключевые поля данных:
    • ИНН (идентификационный номер налогоплательщика).
    • Наименование контрагента (клиента).
    • Сумма сделки (покупки).
  • Типы клиентов: В основном подрядчики, реже - непосредственные заказчики или генеральные подрядчики.

Основные задачи

  1. Извлечение данных: Реализовать надежный механизм чтения и консолидации информации из множества Excel-файлов.
  2. Обработка и анализ: Использовать нейросетевые или алгоритмы интеллектуальной обработки данных для корректной интерпретации и подготовки информации.
  3. Интеграция с API: Настроить автоматическую выгрузку обработанных данных в два указанных веб-сервиса.
  4. Надежность: Обеспечить бесперебойную обработку большого объема данных с минимальным вмешательством пользователя.

Требования к решению

  • Решение должно быть автоматизированным и требовать минимального ручного управления.
  • Необходима устойчивость к возможным несоответствиям в структуре исходных файлов.
  • Важна четкая идентификация конечного потребителя (подрядчика) среди записей.
  • Все конфиденциальные данные (названия, контакты) должны обрабатываться безопасно.

Ожидаемый результат

Готовое программное решение (скрипт, приложение или сервис), которое по заданному расписанию или запросу выполняет полный цикл: чтение Excel-файлов, обработку данных и их загрузку в целевые веб-сервисы.