Техническое задание: Генерация видео с ИИ-аватаром и голосом
Необходимо создать реалистичное видео, где будет представлен цифровой аватар конкретного человека. Аватар должен визуально соответствовать предоставленным фотографическим образцам и озвучивать произвольный текст, заданный заказчиком.
Исходные данные
- Образцы голоса человека (аудиозаписи) для обучения модели синтеза речи.
- Набор фотографий человека для создания визуальной модели (аватара).
Основные требования к результату
- Синхронизация: Движения губ аватара должны быть синхронизированы с произносимым текстом.
- Качество голоса: Синтезированный голос должен максимально соответствовать тембру, интонациям и особенностям оригинального голоса из образцов.
- Визуальное соответствие: Внешность аватара должна быть узнаваемой и созданной на основе предоставленных фотографий.
- Формат: Готовый видеофайл в стандартном формате (например, MP4) с качественным разрешением.
Технологии
Исполнитель должен предложить и обосновать выбор технологий и инструментов на основе ИИ для решения задачи (например, для синтеза речи и генерации видео).