Создание датасета изображений для обучения персонажей AI Girlfriend

Необходимо подготовить качественный набор данных для обучения 30 уникальных LoRA-моделей. Каждая модель будет соответствовать отдельному персонажу с продуманной внешностью, характером и ролью.

Этапы работы

1. Разработка промптов для персонажей

  • Создать шаблон промпта с переменной {{user_input}} для будущей кастомизации пользователем.
  • Для каждого из 30 персонажей определить:
    • Имя
    • Тип внешности (детальное описание: тип красоты, цвет волос, черты лица, телосложение)
    • Характер (3-4 ключевые черты)
    • Социальную роль / фантазийный сценарий (например: соседка, одноклассница, коллега)
  • Пример структуры персонажа: "Девушка-по-соседству" с натуральной красотой, светлыми волосами, добрым и слегка стеснительным характером.

2. Генерация изображений

  • Для каждого персонажа создать 25 уникальных фотографий.
  • Обеспечить разнообразие по:
    • Позам и ракурсам
    • Одежде (повседневная, формальная, нижнее белье)
    • Обстановке и контексту
  • Все изображения должны быть ультрареалистичными и высокого качества (без артефактов).
  • Инструмент для генерации будет предоставлен заказчиком.

3. Постобработка и унификация

  • Из сгенерированных для каждого персонажа 25 фото выбрать наиболее удачный и выразительный вариант лица.
  • С помощью предоставленного инструмента заменить лица на всех остальных изображениях персонажа на выбранный эталон.
  • При необходимости вручную удалить водяные знаки или артефакты.

Критерии качества

  • Разнообразие персонажей: 30 уникальных, продуманных типажей.
  • Качество изображений: максимальная реалистичность, высокое разрешение, отсутствие дефектов.
  • Согласованность датасета: для одного персонажа все 25 фото должны быть узнаваемы как один человек.
  • Детализация промптов: четкие и подробные описания, позволяющие точно генерировать и обучать модель.

Работа кропотливая и требует внимания к деталям, так как от качества датасета напрямую зависит результат обучения итоговых LoRA-моделей.

Разработка агрегатора и суммаризатора новостей из Telegram-каналов

Требуется создать систему для автоматического сбора новостей из множества Telegram-каналов по SEO-тематике. Система должна формировать единую сводку за день с помощью локальной нейросети для обработки текста, без использования платных API.