Техническое задание: Telegram-бот для транскрибации аудио
Необходимо разработать автоматизированного бота для мессенджера Telegram, выполняющего преобразование аудиозаписей в текстовый формат с последующей выгрузкой результата.
Основные функции бота
- Приём файлов: Бот должен принимать аудиофайлы, отправленные как документ (document), с поддержкой размеров до 2 ГБ.
- Транскрибация: Преобразование аудиодорожки в читаемый текст на русском языке. Качество распознавания речи должно быть сопоставимо или лучше современных коммерческих AI-решений.
- Сохранение результата: Автоматическая загрузка готового текстового файла на указанный облачный диск (Яндекс.Диск).
Ключевые требования
- Язык реализации: Python (предпочтительно).
- Интеграция с Telegram Bot API.
- Интеграция с API облачного хранилища Яндекс.Диск.
- Использование мощной модели распознавания речи (например, OpenAI Whisper, Yandex SpeechKit или аналогов) для достижения высокого качества транскрибации.
- Бот должен быть стабильным, обрабатывать ошибки (например, неверный формат файла, проблемы с сетью) и информировать пользователя о статусе операции.
- Желательно реализовать систему очереди задач, если ожидается высокая нагрузка.
Результат работы
- Исходный код бота, развернутый на сервере заказчика или предоставленный как готовое к развертыванию решение.
- Инструкция по настройке и запуску.
- Функционирующий бот, готовый к приему файлов и выполнению транскрибации.