Техническое задание: Автоматизация сбора данных частотности
Цель проекта
Автоматизировать процесс получения и присвоения данных о частотности поисковых запросов для большого массива товарных артикулов.
Исходные данные
- Формат данных: 5 файлов в формате Excel (.xlsx или .xls).
- Объем данных: Общее количество обрабатываемых артикулов - около 3 миллионов.
- Структура файлов: Артикулы для проверки находятся в колонке
D.
Требуемый результат
- В каждый из 5 файлов необходимо добавить данные в последнюю колонку, которая имеет индекс
I. - В колонку
I нужно записать значение частотности для соответствующего артикула из колонки D. - Источник данных: Частотность должна быть получена из сервиса Яндекс.Вордстат.
- Период сбора: Данные о частотности должны быть собраны за продолжительный период - год или другой значительный временной интервал, чтобы получить репрезентативную статистику.
Ключевые задачи для исполнителя
- Разработать скрипт или программу для автоматического сбора данных из Яндекс.Вордстат.
- Обеспечить корректное сопоставление артикула (из колонки D) с его частотностью.
- Реализовать обработку большого объема данных (3 млн строк) с учетом возможных ограничений API или веб-интерфейса источника.
- Записать полученные результаты в указанное место (колонка I) в исходных Excel-файлах.
- Обеспечить устойчивость работы к ошибкам связи и обработку исключительных ситуаций.