Общая цель
Разработать скрипт на Python, работающий по расписанию на Linux/локальном ПК, который выполняет полный конвейер создания аудиконтента без участия человека.
Основные требования:
- Ежедневный запуск в 18:00 по расписанию Linux (cron)
- Парсинг нескольких указанных сайтов для сбора нового текстового контента
- Создание структурированного сценария на основе заданного промпта с помощью локальной открытой LLM-модели (размером ~20B параметров)
- Передача сценария в локальную TTS-систему для генерации качественного WAV-файла
- Обязательная постобработка аудио: нормализация громкости, стабилизация динамического диапазона (компрессия/лимитирование)
- Сохранение итогового файлов в указанную локальную папку на сервере или ОС
- Ежедневная двукратная прогонка конвейера для двух разных источников (с возможностью масштабирования на большее количество сайтов)
Технические уточнения:
- Все модели развернуты строго локально, никаких облачных API
- TTS-движок установлен локально на компьютере
- Языковая модель доступна через REST-интерфейс (draft: l-Studio) или через библиотеку трансформеров PyTorch/HuggingFace
- Приветствуется минимальный веб-интерфейс для ручного запуска/конфигурации (Flask/Dash), но основная работа - через cron
- Кроссплатформенность под Linux - обязательно, стандартный Python-стек бибилиотек
Формат результата:
- Выходной файл - аудио WAV/MP3 со стабильной громкостью, готовый к воспроизведению
- Система логирования и обработки ошибок в каждом модуле