Цель проекта
Разработать готовый к запуску шаблон среды на платформе аренды облачных вычислений: с двумя видеокартами RTX 5090 для работы с моделью Wan 2.2 14B в версии Turbo видео (t-v) и конфигурацией под Qwen3. Настройки должны обеспечивать максимальную скорость генерации при высоком качестве.
Функциональные требования
- Автоматическая настройка SageAttention для ускорения работы с attention-механизмами;
- Предустановленная поддержка Lightning LoRA для оптимизации генерации WAN 2.2;
- Корректные скрипты запуска в много-GPU контейнере (2 GPU RTX 5090);
- Установка и настройка окружения для локального вызова WAN 2.2 генерации;
- Интеграция с системой распараллеливания, стандартной для данной модели;
- При необходимости - использование обвязки для развертывания инференса Qwen3 в этом же образе.
Критерии приёмки
Готовый Docker-образ с минимальными зависимостями, который сразу даёт максимальную скорость генерации. Всё проверяется на платформе с двух-GPU тарифом (без указания названия компании, бренда или торговой марки).