Разработка парсера судебных архивов с AI-фильтрацией
Требуется создать скрипт для автоматического сбора юридической информации из архивных источников с интеллектуальной обработкой через AI-модель.
Основные требования
1. Режим работы (конфигурация)
- Запуск по запросу через конфигурационный файл
- Настройка временного диапазона поиска (например, 2019-2021)
- Ограничение максимального количества результатов за один запуск
- Выбор источников данных (Justia, CourtListener, Reddit или все вместе)
2. Источники данных
- Работа исключительно с архивными данными
- Поддержка судебных архивов Justia/CourtListener
- Возможность парсинга юридических обсуждений с соответствующих платформ
3. Технический стек
- Язык программирования: Python
- Интеграция с OpenRouter API для AI-фильтрации контента
- Интеграция с Google Drive API для сохранения результатов
- Период данных: 2015-2025 годы
4. Функциональность
- Сбор завершенных юридических историй и дел
- Интеллектуальная фильтрация через AI-модель
- Структурированное хранение результатов
- Гибкая настройка параметров поиска