Общее описание проекта
Требуется записать 1000 предложений, используя естественное чтение с чёткой дикцией и спокойной, нейтральной интонацией. Получившийся аудиодатасет будет использован для тренировки модели синтеза речи.
Требования к диктору
- Приятный, мягкий, «милый» тембр голоса
- Чёткое произношение без «каши во рту»
- Нейтрально-спокойный темп речи, без излишней актёрской окраски
Условия записи - Окружение
- Тихий, хорошо изолированный от шумов кабинет/комната
- Отсутствие щелчков, клавиатуры, реверберации, уличного фона, мыши, дыхания в микрофон
- Допускатся умеренная обработка (нормализация, подавление постоянного фона шумов), главное - чистота и естественность
Формат файлов на выходе
- WAV / PCM
- 44,1 кГц, 16 бит
- Mono (один канал)
- Мелкие естественные завершения слов приветствуются (паузы) - но перенасыщение речи шипением /смачноступ возбраняется
После предварительного брифа моей дальнейшей прослушке + сходятся требования - обеспечим к дистанкола бо прямо шина структуру мле