Техническое задание: Настройка системы синтеза речи для создания аудиокниг

Цель проекта

Необходимо развернуть и настроить систему текстового синтеза речи (TTS) для генерации качественных аудиодорожек на башкирском языке. Полученные аудиофайлы будут использоваться для создания многочасовых аудиокниг и последующей публикации на видеоплатформе.

Основные требования

  • Использовать открытые и предобученные модели синтеза речи.
  • Обеспечить возможность обработки больших текстовых объемов для создания аудиокниг продолжительностью в несколько часов.
  • Развернуть решение либо на домашнем компьютере заказчика, либо на стороннем веб-сервере (сайте).
  • Формат и качество выходного аудио должны быть пригодны для публикации на видеохостинге (аналогично предоставленному примеру).
  • Язык синтеза - башкирский.

Исходные данные и ресурсы

  • Для реализации предполагается использование общедоступных TTS-моделей, информация о которых была найдена заказчиком.
  • Предоставлены ссылки на анонс модели, техническую статью и репозиторий с исходными кодами и моделями.

Ожидаемый результат

Готовая к использованию система, позволяющая заказчику самостоятельно загружать текстовые файлы и получать на выходе синтезированные голосовые дорожки в формате, готовом для монтажа и публикации.