Цель проекта
Разработать локальную систему цепочек (workflow) в среде ComfyUI, способную генерировать ультрареалистичные фотографии человека в заданной одежде. Система должна обучаться на десятках фотографий человека (создание LoRa) и обрабатывать изображения одежды с разных ракурсов, в результате создавая десятки итоговых фото в различных позах.
Основные требования
- Обязательная реализация через LoRa: должна быть создана кастомная модель человека для точной передачи внешности и пропорций.
- Использование инструментов генерации: построение workflow на базе Flux2-dev, IDM-VTON или аналогичных решений. Гибкость и комбинаторика узлов допускаются.
- Минимальное влияние текстовых промтов: текстовые описания используются только для указания габаритов модели и размеров одежды (для контроля пропорций). Вся смысловая нагрузка должна идти через визуальные входы.
- Минимальные ручные правки на выходе: цель - довести уровень автоматической обработки до такого состояния, чтобы результат требовал минимального вмешательства человека (или не требовал вовсе).
- Контроль поз: обязательное использование либо загружаемой предустановки позы, либо специальной ноды для управления положением тела (например, OpenPose или аналог).
- Фоны: система должна уметь генерировать изображения как на простых однотонных фонах (белый, серый, розовый, черный), так и на сложных - с предметами, мебелью, интерьером, в зависимости от входного изображения одежды или фона.
- Полная обособленность: рабочее окружение должно функционировать локально, без сторонних API-сервисов, внешних подписок и облачных вычислений. Сеть андерграунд (offline- work возможно, кроме скачивания моделей при старте).
- Оборудование: требуемая вычислительная среда - Tesla V100, 48 GB RAM. Все процессы должны стабильно нагружать такие мощности.
- Допустимый уровень артефактов: до 30% итоговых image могут содержать заметные дефекты (артефакты при ошибках в позе или текстурах), остальные 70% должны быть чистого качества.
Результат за
Срок реализации: 5 дней с момента начала работы. Готовый набор скомпонованных workflow (потоков) в формате файлов (.json/png для ComfyUI) + инструкции по запуску.
Дополнительно
- Название проекта, компаний (если есть во входных данных) удалено. Коммерческие контакты упоминать запрещено.
- Тип проекта: R&D, узкоспециализированный код интерфейса графических нейросетей (diffusion module).