Техническое задание: Сбор ID пользователей ВКонтакте
Цель проекта
Сформировать базу данных, содержащую идентификаторы (ID) персональных страниц действующих учителей средних школ в социальной сети ВКонтакте.
Исходные данные
- Имеется список, включающий примерно 2000 официальных сайтов средних общеобразовательных школ.
- На каждом из этих сайтов существует раздел (страница) с информацией о педагогическом составе.
Основная задача
На основе предоставленного списка сайтов необходимо:
- Найти на каждом сайте страницу с данными учителей (например, "Наши педагоги", "Коллектив", "Учителя").
- Извлечь с этих страниц информацию, позволяющую идентифицировать профили учителей в социальной сети ВКонтакте (упоминания, ссылки).
- Определить и выгрузить актуальные ID (идентификаторы) персональных страниц этих пользователей ВКонтакте.
- Собрать полученные ID в структурированную базу данных.
Ключевые требования
- Сбор должен быть направлен исключительно на действующих учителей.
- Важно обеспечить актуальность и достоверность собранных данных.
- Процесс должен быть максимально автоматизирован для обработки большого объема исходных данных.