Развертывание и настройка open-source DWH и BI-системы

Для небольшой компании требуется создать современную open-source инфраструктуру для хранения и анализа данных. Основная задача - развернуть и связать два продукта на предоставленном хостинге.

Основные задачи

  • Развернуть кластер YTsaurus (open-source DWH) на хостинге заказчика.
  • Настроить YTsaurus для работы в качестве хранилища данных.
  • Установить и развернуть BI-платформу DataLens.
  • Настроить интеграцию между YTsaurus и DataLens для доступа к данным и построения отчетов.
  • Провести базовую конфигурацию систем под нужды небольшой компании.
  • Обеспечить стабильную работу связки.

Требования к исполнителю

  • Опыт работы с распределенными системами хранения данных (DWH).
  • Знание архитектуры и принципов работы YTsaurus или аналогичных систем (Hadoop, ClickHouse).
  • Опыт развертывания и настройки BI-инструментов (DataLens, Superset, Tableau и т.п.).
  • Понимание процессов ETL/ELT и построения аналитических панелей.
  • Умение работать с Linux-серверами и облачными хостингами.

Все детали и специфические требования будут обсуждаться с выбранным исполнителем.

Создание документа Word из фотографий билетов

Необходимо преобразовать 8 фотографий билетов (4 билета по 2 фото) в структурированный документ формата DOCX. Требуется точно сохранить форматирование и расположение текста, как на исходных изображениях.