Техническое задание: Настройка системы синтеза речи для создания аудиокниг

Цель проекта

Необходимо развернуть и настроить систему текстового синтеза речи (TTS) для генерации качественных аудиодорожек на башкирском языке. Полученные аудиофайлы будут использоваться для создания многочасовых аудиокниг и последующей публикации на видеоплатформе.

Основные требования

Использовать открытые и предобученные модели синтеза речи.
Обеспечить возможность обработки больших текстовых объемов для создания аудиокниг продолжительностью в несколько часов.
Развернуть решение либо на домашнем компьютере заказчика, либо на стороннем веб-сервере (сайте).
Формат и качество выходного аудио должны быть пригодны для публикации на видеохостинге (аналогично предоставленному примеру).
Язык синтеза - башкирский.

Исходные данные и ресурсы

Для реализации предполагается использование общедоступных TTS-моделей, информация о которых была найдена заказчиком.
Предоставлены ссылки на анонс модели, техническую статью и репозиторий с исходными кодами и моделями.

Ожидаемый результат

Готовая к использованию система, позволяющая заказчику самостоятельно загружать текстовые файлы и получать на выходе синтезированные голосовые дорожки в формате, готовом для монтажа и публикации.

дизайн

Техническое задание: Настройка системы синтеза речи для создания аудиокниг

Цель проекта

Основные требования

Исходные данные и ресурсы

Ожидаемый результат

Дизайн визиток для команды из 4 человек

Помощь с оформлением Telegram канала

Подготовка видео контента для демонстрации продукта