Задача

Необходимо выбрать подходящую AI-модель (например, на базе OCR+LNL, Tesseract, Google Vision или современных трансформеров для медицинских текстов) и реализовать её подключение к веб-интерфейсу. Пользователь должен иметь возможность загружать на сайт PDF-файлы и картинки с анализами, а модель - извлекать из них структурированные текстовые данные.

Требования к функционалу

  • Поддержка загрузки файлов форматов: PDF, JPG, PNG, JPEG.
  • Автоматическое распознавание и оцифровка текста (изображения с таблицами, лабораторными данными, рукописными пометками).
  • Вывод распознанного текста на экран в понятном для пользователя виде.
  • Сохранение истории распознавания (опционально, база данных или сессия пользователя).

Технический контекст

Уже есть работающий сайт на современном фреймворке (например, React/Vue/Django). Нужна интеграция модульным подходом - либо облачное API, либо собственная обученная модель.

Критические аспекты

  • Точность распознавания медицинских терминов и чисел.
  • Скорость обработки (желательно не более 3-5 секунд на файл).
  • Безопасность загружаемых данных. Необходимо избежать попадания данных (ПД, медицинские записи) в чужие облачные модели.
  • Возможность масштабирования при увеличении нагрузки.