Разработка парсера судебных архивов с AI-фильтрацией

Требуется создать скрипт для автоматического сбора юридической информации из архивных источников с интеллектуальной обработкой через AI-модель.

Основные требования

1. Режим работы (конфигурация)

  • Запуск по запросу через конфигурационный файл
  • Настройка временного диапазона поиска (например, 2019-2021)
  • Ограничение максимального количества результатов за один запуск
  • Выбор источников данных (Justia, CourtListener, Reddit или все вместе)

2. Источники данных

  • Работа исключительно с архивными данными
  • Поддержка судебных архивов Justia/CourtListener
  • Возможность парсинга юридических обсуждений с соответствующих платформ

3. Технический стек

  • Язык программирования: Python
  • Интеграция с OpenRouter API для AI-фильтрации контента
  • Интеграция с Google Drive API для сохранения результатов
  • Период данных: 2015-2025 годы

4. Функциональность

  • Сбор завершенных юридических историй и дел
  • Интеллектуальная фильтрация через AI-модель
  • Структурированное хранение результатов
  • Гибкая настройка параметров поиска

Разработка юридического пакета для SaaS-платформы с подпиской

Требуется подготовить полный юридический комплект документов для веб и мобильной платформы с монетизацией по подписке. Нужно проработать схему и создать все необходимые соглашения для безопасной работы сервиса.