Техническое задание: Разработка системы чтения по губам

Основная задача

Разработать программное обеспечение, способное анализировать видеофрагмент продолжительностью 3 минуты и преобразовывать движение губ говорящего человека в текстовую расшифровку.

Ключевые требования

  • Обработка видеофайла стандартного формата (например, MP4, AVI).
  • Длительность анализируемого видео - 3 минуты.
  • Алгоритм должен фокусироваться на области лица и артикуляции губ.
  • Обеспечение максимально возможной точности распознавания речи.
  • Вывод итогового текста в удобном формате (текстовый файл или интерфейс программы).
  • Решение должно быть готово к практическому использованию.

Ожидаемый результат

Готовая рабочая программа или скрипт, который принимает на вход видео и выдает текстовую расшифровку сказанного, полученную исключительно на основе визуального анализа.