Общая задача
Разработать корпоративный инструмент (GUI-приложение), которое:
- Использует библиотеку Selenium для автоматизации действий в веб-интерфейсе указанного сервиса.
- Пользователь загружает список текстовых промптов.
- Программа авторизуется в сервисе, создает проекты с заданными параметрами.
- Для каждого промпта генерируются два изображения (или изображение и анимация).
- Результаты сохраняются локально в назначенную папку с именами вида: ‘1’, ‘1a’, ‘2’, ‘2a’, ‘3’, ‘3a’ - соответствует очередному сгенерированному файлу.
- Весь процесс происходит полностью автоматически, предотвращая ручные клики.
Порядок реализации
Основные требования:
- Тип нового проекта - по выбору:
- Text-to-video (формат 16:9, модель veo3.1 fast), или
- Create image (модель Nanobanana pro).
- Количество выполнений: каждый загруженный промпт дает два уже готовых результата.
- Сохранение: выбрать целевую папку один раз, после чего все генерируемые файлы складываются туда и именуются по порядку без дублирования имен.
Необходимые предварительные действия заказчика
- Предоставить своими тестовыми или рабочими учётных данных (фейковый аккаунт).
- Подготовить хотя бы минимальный пул тестовых промптов.
Предполагаемые расширения (опционально)
- Поддержка графического прогресс-бара в окне приложения.
- Журнал операций (лог) для отладки.
- Возможность менять выбранную модель или формат непосредственно из GUI.