Разработка воркфлоу в n8n для автоматического сбора мероприятий
Цель проекта
Создать автоматизированный рабочий процесс (воркфлоу) в платформе n8n, который будет собирать информацию о мероприятиях из публичных Telegram-каналов, очищать её от рекламного контента, структурировать и сохранять в заданном формате.
Основные задачи
1. Парсинг данных из Telegram
- Настройка модуля для сбора постов из публичных Telegram-каналов.
- Каналы должны обрабатываться последовательно, согласно списку.
- Реализация тестового режима с ограничением на 1-2 записи с канала для отладки.
2. Очистка и обработка данных
- Фильтрация рекламных постов, промо-записей и нерелевантного контента.
- Реализация механизма дедупликации: проверка на наличие уже сохранённых мероприятий.
- Интеграция с OpenAI GPT API для извлечения структурированных данных из текста постов.
3. Структурирование и сохранение
- Извлечение следующих полей: название, дата, время, место, цена, категория и другие атрибуты.
- Интеграция с Google Sheets для сохранения обработанных данных в готовую таблицу с заданной структурой.
- Обеспечение корректной работы с существующими вкладками (источники и записи).
Требования к исполнителю
- Опыт работы с платформой автоматизации n8n.
- Понимание принципов парсинга веб-данных, желательно опыт с Telegram.
- Умение работать с API (OpenAI, Google Sheets).
Что предоставляется
- Подробное техническое задание.
- Готовая Google Таблица с необходимой структурой и примером данных.
Дополнительная информация
Воркфлоу должен быть построен с учётом потенциального масштабирования. В будущем планируется добавить источники VK и RSS, поэтому архитектура должна быть адаптируемой. На текущем этапе работа ведётся только с Telegram-каналами.