Техническое задание: Интеграция OCR и GPT-4o для образовательного бота
Суть проекта
Существует рабочая версия Telegram-бота для образовательного проекта. Требуется модернизировать его серверную часть, заменив текущий механизм анализа изображений.
Основные задачи
- Настроить сервер на Linux (VPS).
- Разработать скрипт или API для обработки фотографий, поступающих из Telegram-бота.
- Реализовать распознавание текста на русском языке как рукописного, так и печатного с использованием библиотеки PaddleOCR.
- Настроить отправку распознанного текста в модель OpenAI GPT-4o через API.
- Организовать получение ответа от модели (анализ, выявление ошибок, пояснения) и его возврат пользователю в Telegram.
Технологический стек
- Язык программирования: Python.
- OCR: PaddleOCR.
- Анализ текста: OpenAI API (GPT-4o).
- Платформа: Linux VPS.
- Интеграция с Telegram Bot API.
Ожидаемые результаты
- Настроенный и работающий сервер.
- Установленный и протестированный PaddleOCR.
- Рабочий скрипт или API-эндпоинт для обработки изображений.
- Подробная инструкция по запуску и поддержке системы.
- Тестовый пример работы всей цепочки через Telegram-бота.
Дополнительные пожелания
Приветствуется опыт работы с OCR-системами и наличие портфолио с похожими проектами. Проект рассчитан на длительное сотрудничество с возможностью дальнейшей технической поддержки.
Срок выполнения: 5-7 дней