Задача
Необходимо обучить нейросеть (любую подходящую) генерировать голос, который полностью соответствует нашему бренду. На данный момент у нас нет подходящего инструмента для качественной озвучки роликов.
Что требуется сделать
- Подобрать или создать модель нейросети для синтеза речи.
- Обучить модель на предоставленных образцах голоса, который мы выбрали в качестве референса.
- Обеспечить высокое качество генерации для форматов Reels и Shorts (естественное звучание, правильные интонации, отсутствие 'металлического' звука).
Результат
Готовая к использованию, протестированная модель, способная синтезировать голос в выбранном нами стиле для постоянной озвучки видеоконтента.