Техническое задание: Бот-анализатор активности Telegram-группы

Цель проекта

Разработать консольное приложение (бота) для авторизации в Telegram, выбора целевой группы и проведения глубокого статистического анализа всей истории сообщений с формированием структурированного отчета.

Основные функции и механика

  • Запуск и работа через консоль.
  • Авторизация бота под указанным аккаунтом Telegram.
  • Интерфейс выбора целевой группы из списка доступных.
  • Парсинг всей истории сообщений выбранной группы.
  • Генерация итогового текстового файла с результатами анализа.

Требуемая статистика для группы (общий отчет)

  1. Общее количество всех сообщений.
  2. Статистика по словам: общее количество и ТОП-10 самых популярных слов.
  3. ТОП-5 самых часто используемых стикеров.
  4. Самый активный день (по общему числу сообщений, а также отдельно с медиафайлами и без).
  5. Количество дней без активности (дней, когда сообщений не было).
  6. Общее количество голосовых сообщений и видеосообщений (кружков).
  7. Самый активный участник по общему числу сообщений.
  8. Самый активный участник по количеству голосовых и видеосообщений.
  9. Самый активный участник по количеству фото и видео.
  10. Самый активный участник по количеству написанных слов.
  11. Самый активный участник по количеству отправленных стикеров.
  12. Помесячная статистика активности (график или таблица).
  13. Самое популярное слово в каждом месяце.
  14. Самый активный участник в каждом месяце.

Требуемая статистика для каждого участника (индивидуальный отчет)

  1. Общее количество отправленных сообщений.
  2. Статистика по словам: общее количество и ТОП-10 популярных слов.
  3. Самый часто используемый стикер.
  4. Самый активный день данного участника.
  5. Количество дней, когда участник не проявлял активности.
  6. Общее количество его голосовых и видеосообщений.
  7. Помесячная статистика его активности.

Технические требования

  • Приложение должно быть написано на Python.
  • Использование официальных API Telegram (библиотека Telethon или аналогичная).
  • Код должен быть структурированным, читаемым и с комментариями.
  • Результаты должны корректно записываться в читаемый текстовый файл.

Разработка геопространственной базы данных для агрегации и анализа данных о недвижимости

Требуется создать единую геопространственную базу данных, объединяющую несколько публичных источников (история продаж, кадастр, энергоэффективность, адреса, фотоархивы). Система должна обеспечивать корректное сопоставление объектов недвижимости даже при наличии неполных или приблизительных входных данных.