Техническое задание: Подбор и настройка TTS-голоса
Основная цель
Найти и настроить женский синтезированный голос (Text-to-Speech) для русского языка, который будет соответствовать следующим ключевым характеристикам:
- Уверенное и спокойное звучание.
- Максимально естественное, «человеческое» произношение без эффекта «робота».
- Высококачественная и управляемая передача пауз в речи.
Конкретные задачи
- Подбор голосов: Выбрать 1-2 наиболее подходящих голосовых движка или модели TTS.
- Детальная настройка параметров:
- Скорость речи (три варианта: медленная, нормальная, ускоренная).
- Расстановка и длительность пауз.
- Корректировка интонационной модели.
- Создание правил: Разработать рекомендации по написанию и форматированию текста для идеального синтеза выбранным голосом (например, разметка для пауз, ударений).
- Подготовка демонстраций: Создать 10-15 аудио-примеров с разным текстом для проверки качества.
Требуемый результат
- Документ с финальными настройками голоса (параметры скорости, пауз, интонации).
- Пакет аудио-файлов с примерами синтеза.
- Рекомендации для разработчика по интеграции и использованию голоса.
Критерии приемки работы
- Голос звучит естественно и не вызывает ощущения «машинности».
- Во всех примерах корректно проставлены ударения в словах.
- Паузы в речи четко различимы и логически обоснованы.
- Предоставленные варианты скорости речи (медленно/нормально/быстро) объективно отличаются друг от друга.