Техническое задание: Автоматизация сбора данных частотности

Цель проекта

Автоматизировать процесс получения и присвоения данных о частотности поисковых запросов для большого массива товарных артикулов.

Исходные данные

  • Формат данных: 5 файлов в формате Excel (.xlsx или .xls).
  • Объем данных: Общее количество обрабатываемых артикулов - около 3 миллионов.
  • Структура файлов: Артикулы для проверки находятся в колонке D.

Требуемый результат

  • В каждый из 5 файлов необходимо добавить данные в последнюю колонку, которая имеет индекс I.
  • В колонку I нужно записать значение частотности для соответствующего артикула из колонки D.
  • Источник данных: Частотность должна быть получена из сервиса Яндекс.Вордстат.
  • Период сбора: Данные о частотности должны быть собраны за продолжительный период - год или другой значительный временной интервал, чтобы получить репрезентативную статистику.

Ключевые задачи для исполнителя

  • Разработать скрипт или программу для автоматического сбора данных из Яндекс.Вордстат.
  • Обеспечить корректное сопоставление артикула (из колонки D) с его частотностью.
  • Реализовать обработку большого объема данных (3 млн строк) с учетом возможных ограничений API или веб-интерфейса источника.
  • Записать полученные результаты в указанное место (колонка I) в исходных Excel-файлах.
  • Обеспечить устойчивость работы к ошибкам связи и обработку исключительных ситуаций.