Задача
Необходимо выбрать подходящую AI-модель (например, на базе OCR+LNL, Tesseract, Google Vision или современных трансформеров для медицинских текстов) и реализовать её подключение к веб-интерфейсу. Пользователь должен иметь возможность загружать на сайт PDF-файлы и картинки с анализами, а модель - извлекать из них структурированные текстовые данные.
Требования к функционалу
- Поддержка загрузки файлов форматов: PDF, JPG, PNG, JPEG.
- Автоматическое распознавание и оцифровка текста (изображения с таблицами, лабораторными данными, рукописными пометками).
- Вывод распознанного текста на экран в понятном для пользователя виде.
- Сохранение истории распознавания (опционально, база данных или сессия пользователя).
Технический контекст
Уже есть работающий сайт на современном фреймворке (например, React/Vue/Django). Нужна интеграция модульным подходом - либо облачное API, либо собственная обученная модель.
Критические аспекты
- Точность распознавания медицинских терминов и чисел.
- Скорость обработки (желательно не более 3-5 секунд на файл).
- Безопасность загружаемых данных. Необходимо избежать попадания данных (ПД, медицинские записи) в чужие облачные модели.
- Возможность масштабирования при увеличении нагрузки.