Техническое задание: Обработка видео с YouTube
Основная задача
Необходимо скачать весь видеоконтент с двух указанных YouTube-каналов (общее количество видео - 422) и преобразовать речь из каждого ролика в текстовый формат.
Этапы работы
1. Скачивание видео
- Выгрузить все доступные видео с двух заданных каналов.
- Общее количество видеофайлов для обработки: 422.
- Обеспечить корректное сохранение и организацию файлов.
2. Транскрибация (расшифровка)
- Выполнить точную текстовую расшифровку (транскрибацию) аудиодорожки каждого видео.
- Результатом должен стать 422 отдельных текстовых файла (по одному на каждое видео).
3. Подготовка текстов для нейросети
- Все полученные текстовые файлы необходимо будет загрузить в инструмент на основе ИИ для последующей очистки.
- С помощью нейросети требуется удалить все вводные фразы (приветствия, представления), заключительные реплики (прощания, призывы подписаться) и прочий нерелевантный шаблонный текст, не относящийся к основному содержанию видео.
- Цель - оставить только содержательную часть высказываний.
Требования к результату
- 422 текстовых файла в согласованном формате (например, .txt или .docx).
- Тексты должны быть чистыми, без технических артефактов, с четкой структурой.
- Файлы должны быть готовы к загрузке в систему для автоматической обработки.