Разработка скрипта для подготовки обучающих данных

Цель проекта

Создать инструмент для автоматической обработки неструктурированных текстовых данных и формирования готового датасета в формате CSV, который можно напрямую использовать для дообучения языковой модели.

Основные требования

  • Разработка Python-скрипта, принимающего на вход текстовые файлы с диалогами
  • Преобразование данных в структурированный CSV-файл с четко определенными колонками
  • Обеспечение корректного формата данных для последующего использования в тренировочных пайплайнах
  • Скрипт должен быть документирован и готов к интеграции в процесс обработки данных

Технические детали

Формат выходного файла должен соответствовать стандартам, принятым для обучения современных языковых моделей. Важно предусмотреть обработку различных сценариев входных данных и возможных ошибок формата.

Доработка адаптивной версии сайта на Opencart 3

Требуется внести ряд исправлений в мобильную версию мультиязычного и мультидоменного интернет-магазина на Opencart 3.0.3. Все изменения должны корректно работать на всех языках и доменах проекта.

Маркетинговый опрос покупателей триммеров для бритья

Нужно провести видео-интервью с покупателями триммеров. Условия: вы должны были купить и пользоваться триммером в этом году на крупных маркетплейсах, не быть связаны с продажей или оформлением этого товара. Видеосвязь обязательна.

SEO продвижение сайта с глубокой проработкой семантики

Требуется профессиональная SEO-оптимизация сайта (14 лет, 500 страниц на WordPress). Нужна глубокая проработка семантики, оптимизация контента и изображений, новые статьи и лента новостей. Расчет на профи с портфолио и кейсами.