Разработка и дообучение AI-ассистента для автомобильной сферы

Мы - крупный игрок на рынке автохимии с глубокой экспертизой в индустрии. Наша цель - создать технологичный продукт: AI-ассистента для профессиональных детейлеров, который будет использовать накопленные уникальные знания. Для этого требуется преобразовать наш экспертный контент в интеллектуальный продукт.

Основные задачи проекта

  • Преобразование базы знаний: Структурирование экспертного контента в качественный датасет, пригодный для Supervised Fine-Tuning.
  • Дообучение языковой модели: Проведение тонкой настройки (Fine-tuning) выбранной открытой LLM (например, Gemma, T Pro или других моделей - варианты к обсуждению) на наших локальных вычислительных мощностях.
  • Валидация качества: Оценка и проверка ответов модели с учетом узкоспециализированной тематики детейлинга и автохимии.

Требуемый стек и компетенции

  • Практический опыт работы с библиотекой Hugging Face (Transformers).
  • Понимание и опыт применения методов параметрически-эффективной тонкой настройки (PEFT/LoRA).
  • Знание архитектур и подходов RAG (Retrieval-Augmented Generation) и работы с эмбеддингами.
  • Навыки подготовки и обработки датасетов для обучения моделей.
  • Умение работать с локальным инференсом (развертывание и запуск моделей на собственном железе).

Мы открыты к рассмотрению ваших предложений по выбору конкретной модели и методологии дообучения.

Проработка и сбор информации с использованием Word и Perplexity AI

Требуется последовательно запускать промпты в Perplexity AI, копировать полученные результаты и сохранять их в документы Word. Общее время работы - до 3 часов. Есть возможность ускорить процесс за счет параллельного запуска.