Разработка браузерного AI-ассистента с голосовым сопровождением
Основная концепция
Необходимо создать живого экранного аналитика, который в реальном времени отслеживает и анализирует происходящее в браузере пользователя. Ассистент должен реагировать на изменения интерфейса и контента, а не просто выполнять разовый анализ.
Ключевые функции
- Контентный мониторинг экрана с голосовым сопровождением
- Анализ DOM-структуры и содержимого страниц
- Отслеживание изменений интерфейса во времени
- Контекстный AI-анализ наблюдаемой информации
- Голосовой вывод результатов анализа
Архитектурные варианты реализации
Возможные подходы:
- Браузерное расширение (DOM + события → AI → голос)
- Расширение с real-time мониторингом изменений интерфейса
- Гибридная архитектура (extension + backend)
Дополнительные опции
- Голосовой ввод (опционально)
- Скриншоты только как дополнительная функция, не основа системы
Требования к совместимости
Поддерживаемые браузеры:
- Chrome
- Edge
- Firefox
- Brave
- Opera
- Vivaldi
- Arc
- Любые Chromium-based браузеры
Ограничения и уточнения
- Система не должна быть чат-ботом
- Не должен выполнять только разовый анализ изображений
- Основной фокус - живая реакция на события в браузере
Исполнитель может предложить оптимальную архитектуру и вариант реализации, основанный на технической целесообразности.