Задача: Система мониторинга спортивного контента
Необходимо разработать бота-парсера, который будет регулярно собирать новости по спорту из указанных источников (Telegram-каналы, 2-3 открытых веб-сайта), фильтровать их по ключевым словам и пересылать наиболее релевантные из них в специальный Telegram-чат.
Основные функции
- Парсинг контента по расписанию (раз в N минут/часов)
- Фильтрация по новости по набору ключевых слов (слова по разным видам спорта)
- Отправка отфильтрованных новостей в закрытый Telegram-чат
- Ведение простой статистики: общее количество собранных, отфильтрованных и отправленных новостей, популярные ключевые слова.
Требования к реализации
- Предпочтительный язык: Python (с библиотеками request, beautifulsoup, telethon/pyrogram)
- Необходима база данных для хранения истории отправленных постов и статистики (SQLite подойдет)
- Простое управление через конфигурационный файл (yaml/cfg) или минимальную админ-панель для добавления слов и паузы обновления
- Срок сдачи: до 30 января