Задача
Требуется создать Telegram-бота для автоматического парсинга информации с веб-сайта. Результаты работы бота должны сохраняться в табличных форматах (.xlsx, .csv, .json) для последующего анализа.
Основные требования
- Язык реализации: Python
- Библиотеки: aiogram для бота, requests/aiohttp для запросов, BeautifulSoup/lxml для парсинга
- Возможность инициировать парсинг по команде от пользователя
- Сбор всех определенных типов данных с целевого сайта
- Сохранение результатов в совместимом формате
Алгоритм работы
Пользователь отправляет боту команду запуска, после чего происходит:
- Подключение к сайту через библиотеки HTTP запросов
- Изучение структуры HTML страниц
- Извлечение всех необходимых полей
- Формирование таблицы с данными
- Отправка готового файла пользователю
Пожелания по реализации
Бот должен корректно обрабатывать CAPTCHA или блокировки (если есть), использовать задержки между запросами для имитации поведения человека. Также приветствуется работа как с HTML, так и с динамически загружаемым контентом при необходимости.