Техническое задание: Доработка алгоритма PPO

Необходимо выполнить анализ и улучшение кода, реализующего алгоритм обучения с подкреплением Proximal Policy Optimization (PPO).

Исходные материалы

  • Исходный код проекта размещен в репозитории.
  • В архиве с проектом также находится научная статья, описывающая теоретические основы и детали реализации.

Основные задачи

  • Изучить предоставленный исходный код и сопутствующую документацию.
  • Проанализировать реализацию на предмет соответствия алгоритму PPO.
  • Предложить и внести улучшения в код для повышения его эффективности, читаемости или производительности.
  • Обеспечить понятность и чистоту итогового кода.

Требования к исполнителю

  • Опыт работы с фреймворками для машинного обучения (например, PyTorch, TensorFlow).
  • Глубокое понимание алгоритмов обучения с подкреплением, в частности PPO.
  • Умение работать с чужим кодом и технической документацией.

Разработка Telegram-бота с ИИ для косметологии

Требуется создать Telegram-бота с интеграцией языковой модели ИИ для помощи косметологам. Функционал: помощь в диагностике, расшифровка анализов, генерация контента, анализ изображений. Реализация монетизации через платную генерацию ответов.