Разработка браузерного AI-ассистента с голосовым сопровождением

Основная концепция

Необходимо создать живого экранного аналитика, который в реальном времени отслеживает и анализирует происходящее в браузере пользователя. Ассистент должен реагировать на изменения интерфейса и контента, а не просто выполнять разовый анализ.

Ключевые функции

Контентный мониторинг экрана с голосовым сопровождением
Анализ DOM-структуры и содержимого страниц
Отслеживание изменений интерфейса во времени
Контекстный AI-анализ наблюдаемой информации
Голосовой вывод результатов анализа

Архитектурные варианты реализации

Возможные подходы:

Браузерное расширение (DOM + события → AI → голос)
Расширение с real-time мониторингом изменений интерфейса
Гибридная архитектура (extension + backend)

Дополнительные опции

Голосовой ввод (опционально)
Скриншоты только как дополнительная функция, не основа системы

Требования к совместимости

Поддерживаемые браузеры:

Chrome
Edge
Firefox
Brave
Opera
Vivaldi
Arc
Любые Chromium-based браузеры

Ограничения и уточнения

Система не должна быть чат-ботом
Не должен выполнять только разовый анализ изображений
Основной фокус - живая реакция на события в браузере

Исполнитель может предложить оптимальную архитектуру и вариант реализации, основанный на технической целесообразности.

копирайтинг