Техническое задание: Система автоматизированной генерации изображений
Цель проекта
Создать и развернуть на выделенном Linux-сервере полнофункциональную систему для генерации изображений по текстовым описаниям (text-to-image) на базе Stable Diffusion и интерфейса ComfyUI.
Основные компоненты системы
1. Развертывание и настройка ядра
- Установка последней стабильной версии ComfyUI на Linux-сервере
- Оптимизация конфигурации для надежной и производительной работы
- Подключение необходимых кастомных нод и расширений для ComfyUI
2. Подготовка моделей генерации
- Настройка трех базовых моделей Stable Diffusion (например, SDXL) в различных стилях:
- Фотореалистичный стиль
- Премиум-стиль (гламур, высокая мода)
- Аниме-стиль
- Обеспечение корректной работы всех моделей в системе
3. Разработка интеллектуального воркфлоу (Workflow)
- Создание автоматической логики выбора модели на основе анализа текстового промпта или явного указания пользователя
- Реализация дополнительных функций обработки:
- Генерация на основе изображения (img2img)
- Контроль позы персонажей (интеграция OpenPose)
- Обеспечение консистентности лиц (использование LoRA/Embedding)
- Постобработка результатов (апскейлинг, ретушь)
Требования к реализации
- Система должна быть полностью автономной и работать на нашем сервере
- Обеспечить стабильность и отказоустойчивость решения
- Документирование процесса установки и настройки
- Предоставление инструкций по использованию и расширению системы