Разработка DAG для загрузки рыночных данных в Apache Airflow

Необходимо создать надежный и эффективный пайплайн для ежедневного сбора финансовой информации.

Основная задача

Разработать Directed Acyclic Graph (DAG) для платформы Apache Airflow, который будет автоматически загружать, обрабатывать и сохранять данные с биржи.

Ключевые требования

  • Изучить публичное API биржи для получения данных о ценных бумагах и исторических котировках.
  • Спроектировать и реализовать ETL-процесс (Extract, Transform, Load) в рамках Airflow DAG.
  • Обеспечить обработку ошибок и повторные попытки загрузки при сбоях.
  • Реализовать логирование ключевых этапов работы пайплайна.
  • Организовать хранение загруженных данных в удобном формате (например, CSV, база данных).
  • Настроить расписание регулярного выполнения задачи (например, ежедневно после закрытия торговой сессии).

Ожидаемый результат

  • Рабочий DAG-файл для Apache Airflow, готовый к развертыванию.
  • Документация по настройке и запуску пайплайна.
  • Код должен быть читаемым, модульным и сопровождаемым.