Техническое задание: Развертывание системы генерации видео

Цель проекта - создать рабочую среду для генерации коротких видеороликов с использованием передовых нейросетевых моделей.

Основные задачи системы

  • Генерация видео на основе исходного изображения (Image → Video).
  • Генерация видео по текстовому описанию (Text → Video).

Требования к технологическому стеку

Поддерживаемые модели (необходимо реализовать минимум одну):

  • AnimateDiff-Lightning в связке с текстовой моделью
  • CogVideoX-5B или CogVideoX-2B
  • Open-Sora
  • SkyReels (версии V1 или V2)
  • ModelScope
  • DynamiCrafter (для комбинированного workflow: текст → изображение → видео)

Требования к интерфейсу и развертыванию:

  • Разработка удобного веб-интерфейса на базе Gradio.
  • Обеспечение доступа к интерфейсу через туннелирующие сервисы (например, ngrok или localtunnel).
  • Система должна быть развернута и функционировать в облачной среде Google Colab Pro.

Ожидаемый результат

Полностью работоспособный инструмент с веб-интерфейсом, позволяющий пользователю загружать изображения или вводить текстовые промпты для генерации видеофайлов с помощью выбранной нейросетевой модели.

Сбор базы активных Telegram-каналов и чатов для турецкой аудитории

Необходимо вручную собрать базу рабочих Telegram-сообществ (каналов и чатов) с активной турецкой аудиторией. Требуется проверка активности, живых участников и открытых комментариев. Результат - структурированная таблица.

Создание видеоролика с заменой лица актера с помощью дипфейк-технологий

Требуется заменить голову/лицо актера в сложной динамичной сцене. Исходный материал в 4K, длительность 5 минут. Имеются подготовленные маски для работы. К работе предъявляются высокие требования к качеству итогового результата.