Задача

Настроить интеллектуального агента на базе ИИ для преобразования текстового контента из 100 книг в качественные аудиофайлы. Результат должен быть подготовлен для прослушивания на различных устройствах без потери качества и читаемости.

Требования к исполнителю

  • Подтвержденный релевантный опыт работы с ИИ-агентами и голосовыми модели (TTS/STT)
  • Опыт обработки больших массивов текстовой информации (от 100 книг)
  • Знание современных инструментов синтеза речи (Google Cloud TTS, Amazon Polly, ElevenLabs и аналоги)
  • Умение организовать пакетную обработку данных (batch processing)
  • Возможность контролировать и тестировать качество аудио на разных форматах (MP3, WAV, FLAC)

Необходимые шаги

  1. Проанализировать исходный список книг и подготовить текстовой контент (в формате .txt, .pdf или .epub)
  2. Разработать архитектуру агента с модулями предобработки, синтеза и пост-мастеринга
  3. Настроить параметры голоса (скорость, интонации, паузы) для естественного озвучивания
  4. Протестировать пайплайн на одной книге, учесть авто-раздукраску на паузы и смену речи
  5. Запустить цикл для всех 100 книг, обеспечить документирование файлов (название, номер, качество звука)
  6. Формат финальных файлов: .mp3 (192 kbps или выше), одинаковая структура для метаданных (автор, название, продюсер)

Итоговые аудиофайлы должны храниться в облачном или локальном хранилище. Срок и бюджет уточняются в личных сообщениях.