Техническое задание: Система автоматической обработки подкастов
Цель проекта
Разработать полностью автоматизированное решение для извлечения, обработки и хранения аудиозаписей русскоязычных подкастов.
Основные функции системы
- Парсинг и загрузка: Автоматический сбор подкастов в максимально доступном качестве с популярных аудиоплатформ (таких как YouTube, RuTube, SoundCloud и аналогичных).
- Устранение дубликатов: Система должна избегать повторного скачивания уже обработанного контента.
- Хранение: Загрузка аудиофайлов либо в локальное хранилище, либо в облачное S3-совместимое хранилище на выбор.
- Очистка аудио: Автоматическая обработка аудиопотока для:
- Удаления фоновой музыки.
- Подавления шумов и артефактов.
- Сохранения только чистой речи дикторов.
- Управление файлами: Автоматическое удаление исходных необработанных аудиофайлов после успешной очистки.
Требования к результату
- Стабильная, отказоустойчивая система, работающая без постоянного ручного вмешательства.
- Четкий, структурированный и документированный код для возможной дальнейшей поддержки и развития.
- Система должна быть готова к развертыванию и использованию.