Разработка голосового AI-агента
Основная задача
Создание программного решения для автоматизации голосовых коммуникаций. Агент должен самостоятельно работать со списком номеров, совершать и принимать звонки, а также вести осмысленный диалог с пользователем.
Ключевые функции и требования
Телефония (SIP)
- Интеграция с SIP-сервером для совершения исходящих звонков по предоставленному списку номеров.
- Возможность приема входящих звонков.
- Стабильное поддержание соединения и обработка событий звонка.
Обработка аудиопотока
- Реализация VAD (Voice Activity Detection) для определения начала и конца речи пользователя.
- Стриминг аудиоданных с микрофона в реальном времени в облачный AI-сервис для распознавания и анализа.
- Получение текстового ответа от AI-движка.
Синтез речи (TTS)
- Интеграция с заданным TTS-сервисом для преобразования текстовых ответов AI в естественную речь.
- Воспроизведение синтезированной речи в аудиопоток звонка.
Логика работы агента
- Автоматический запуск обзвона по списку.
- Управление диалогом на основе ответов AI.
- Обработка ошибок и сбоев в соединении.
- Логирование результатов звонков.
Ожидаемый результат
Готовое к развертыванию решение в виде сервиса или приложения, способное функционировать автономно, вести диалоги с пользователями и интегрироваться с указанными внешними API.