Цель проекта
Создать программу или скрипт, который принимает на вход две сущности: изображение человека (фото) и короткое видео с любым человеком. На выходе система должна генерировать новое видео, в котором лицо с исходной фотографии двигается (плавно, с естественной мимикой, поворотами, морганием, говорить начинает видео) в точности как на эталонном видео. Важно добиться photo-realistic результата - чтобы не было видно искажений, замены цвета кожи, артефактов склейки.
Требования к результату
- Глубокий интерграда: анимация не должна изменять черты лица с фотографии (прическа, цвет глаз, форма носа и т.п.) - меняется только движение/мимика.
- Полностью устранить мерцание, шлейфы, «маску», характерное для многих Deep Fake методов средней сложности.
- Возможность корректировки степени открытия рта, поворота головы - чтобы результирующее видео нельзя было легко распознать как синтезированное.
- Высокое разрешение исходников (как минимум FullHD).
Ограничения
- Не использовать публичные онлайн-сервисы с ограничением на лица - всё локально или на арендованной видеокарте.
- Исходные данные (фото человека, лицо с видео) предоставляются только исполнителю через клиент/подрядчика - конфиденциальность гарантируется.
Бюджет и сроки
Точные цифры и время согласовываются после brief инструментов. Работы должны соответствовать 1-2 видеопримерам (тесты делаются для каждого): сначала один примера настроенный (proof-of-concept), затем финальные 3-4 видео известными моментация. В work сжатая демо показам обязательства видеть.
Итоговй пакет: скрипты, docker-образ (если потребуется), документация по запуску и описаиием функцияним управленни.