Техническое задание: Настройка системы синтеза речи для создания аудиокниг
Цель проекта
Необходимо развернуть и настроить систему текстового синтеза речи (TTS) для генерации качественных аудиодорожек на башкирском языке. Полученные аудиофайлы будут использоваться для создания многочасовых аудиокниг и последующей публикации на видеоплатформе.
Основные требования
- Использовать открытые и предобученные модели синтеза речи.
- Обеспечить возможность обработки больших текстовых объемов для создания аудиокниг продолжительностью в несколько часов.
- Развернуть решение либо на домашнем компьютере заказчика, либо на стороннем веб-сервере (сайте).
- Формат и качество выходного аудио должны быть пригодны для публикации на видеохостинге (аналогично предоставленному примеру).
- Язык синтеза - башкирский.
Исходные данные и ресурсы
- Для реализации предполагается использование общедоступных TTS-моделей, информация о которых была найдена заказчиком.
- Предоставлены ссылки на анонс модели, техническую статью и репозиторий с исходными кодами и моделями.
Ожидаемый результат
Готовая к использованию система, позволяющая заказчику самостоятельно загружать текстовые файлы и получать на выходе синтезированные голосовые дорожки в формате, готовом для монтажа и публикации.