Задача

На основе предоставленного документа (Google Docs) собрать и кластеризовать семантику для корпоративного сайта таксопарка в Ижевске. Задание подразумевает использование проверенных методов группировки ключевых слов по коммерческим и информационным намерениям.

Основные требования

  • Семантика должна учитывать структуру сайта главную страницу, внутренние разделы услуг, аренду автомобилей с водителем, трансфер в/из аэропорта.
  • Кластеризация необходима по геонимологизмам (например, без марки авто, по маркам авто, по службам такси).
  • По каждой подгруппе выделить наиболее приоритетные (частотные) запросы и второстепенные.
  • Итоговым файлом ожидается формат XML или список уточненный, пригодный для загрузки в программы анализа семантики.

Область покрытия

Упоминавшаяся документация содержит строковые варианты запросов, по которым можно выстроить чистую семантическую модель. Важно не переносить номера телефонов и названия брендов таксопарков конечные результаты должны быть применимы к любому автопарку в Ижевске.