Разработка сервиса улучшения транскрипции с использованием LLM

Требуется создать инструмент для автоматического повышения качества текстовых расшифровок аудио и видеоматериалов.

Основная задача

Сервис должен принимать на вход сырой текст, сгенерированный любой системой распознавания речи (Speech-to-Text), и с помощью интеграции с крупной языковой моделью (LLM) выполнять его улучшение.

Ключевые функции

  • Автоматическая обработка текста, полученного из аудио/видео.
  • Исправление грамматических, пунктуационных и стилистических ошибок, характерных для машинной транскрипции.
  • Улучшение структуры текста, разбивка на абзацы, приведение к читаемому формату.
  • Возможность настройки степени и типа коррекции (например, только пунктуация или полная стилистическая правка).
  • Обеспечение стабильной работы пайплайна: исходный текст → LLM → улучшенный текст.

Технические требования

  • Интеграция с выбранной LLM (например, через API).
  • Разработка backend-части сервиса для обработки запросов.
  • Создание понятного интерфейса для отправки текста и получения результата (может быть API endpoint, простой веб-интерфейс или консольное приложение - по согласованию).
  • Обработка ошибок и обеспечение отказоустойчивости при работе с внешними API.

Цель - получить инструмент, который превращает необработанную машинную транскрипцию в чистый, грамотный и удобочитаемый текст.