Техническое задание: Сбор ID пользователей ВКонтакте

Цель проекта

Сформировать базу данных, содержащую идентификаторы (ID) персональных страниц действующих учителей средних школ в социальной сети ВКонтакте.

Исходные данные

  • Имеется список, включающий примерно 2000 официальных сайтов средних общеобразовательных школ.
  • На каждом из этих сайтов существует раздел (страница) с информацией о педагогическом составе.

Основная задача

На основе предоставленного списка сайтов необходимо:

  1. Найти на каждом сайте страницу с данными учителей (например, "Наши педагоги", "Коллектив", "Учителя").
  2. Извлечь с этих страниц информацию, позволяющую идентифицировать профили учителей в социальной сети ВКонтакте (упоминания, ссылки).
  3. Определить и выгрузить актуальные ID (идентификаторы) персональных страниц этих пользователей ВКонтакте.
  4. Собрать полученные ID в структурированную базу данных.

Ключевые требования

  • Сбор должен быть направлен исключительно на действующих учителей.
  • Важно обеспечить актуальность и достоверность собранных данных.
  • Процесс должен быть максимально автоматизирован для обработки большого объема исходных данных.