Задача

Необходимо выполнить транскрибацию 100 телефонных звонков на английском языке, записанных в формате MP3. Требуется подобрать надежную нейросеть или онлайн-сервис, который качественно преобразует аудио в текст с минимальными ошибками (с учетом акцентов, шумов, пауз).

Что предоставляется

  • 100 MP3-файлов звонков.

Требования к результату

  • Текстовая расшифровка каждого звонка в формате TXT или DOCX.
  • Высокая точность распознавания речи (допускаются небольшие поправки знаков препинания, но смысл не должен теряться).
  • Разметка временных меток для длительных пауз или смены говорящего - по возможности.
  • Итоговый файл должен содержать текст отдельных звонков, разделенных четкими заголовками (например, дата или номер).

Важно

  • Убедиться, что нейросеть поддерживает именно телефонную речь (часто с нечеткой дикцией или окружающими шумами).
  • Файлы передаются через облачное хранилище по ссылкам, либо единым архивом.

Срок выполнения

Обсуждается индивидуально; при большом объеме возможна поэтапная сдача.