Разработка системы диаризации и идентификации голосов

Необходимо создать программное решение, которое автоматически обрабатывает аудиозаписи совещаний, преобразует речь в текст с привязкой к конкретным участникам.

Основные функции системы

  • Транскрибация: Преобразование аудиопотока (русская речь) в текстовый формат с высокой точностью.
  • Диаризация: Автоматическое разделение записи на речевые сегменты по разным говорящим.
  • Идентификация спикеров: Сопоставление каждого речевого сегмента с голосовым профилем сотрудника из предварительно сформированной базы (до 60 человек).
  • Управление голосовой базой: Возможность регистрации сотрудников путем записи образца их голоса (несколько секунд/минут).
  • Формирование отчета: Предоставление итогового текста с временной разметкой и указанием имени спикера. Неопознанные голоса должны маркироваться как "Неизвестный".

Ключевые требования

  • Экономичность: Архитектура и выбор инструментов должны минимизировать ежемесячные эксплуатационные расходы.
  • Обработка наложений: Система должна корректно работать в ситуациях, когда несколько человек говорят одновременно (overlapping speech).
  • Гибкость реализации: Допускается использование облачных API, полностью open-source решений или их гибрида.

Ожидаемый результат от исполнителя

В отклике необходимо предоставить:

  1. Предлагаемый технологический стек (модели, сервисы, библиотеки).
  2. Примерную оценку ежемесячной стоимости эксплуатации.
  3. Сроки выполнения проекта.
  4. Описание релевантного опыта работы с аудио, машинным обучением и распознаванием речи (желательно с примерами проектов).

Итоговый продукт: Исполнитель предоставляет исходный код проекта. Разработка сложного пользовательского интерфейса или API не требуется - решение будет интегрировано в существующую инфраструктуру заказчика.

Дизайн-проект и 3D-визуализация интерьера в стиле современная французская классика

Требуется обновить дизайн квартиры площадью 105 м² без изменения планировки. Необходимо создать концепцию в стиле современной французской классики и подготовить фотореалистичные 3D-визуализации. Имеются все обмерные чертежи.

Сбор базы данных магазинов музыкальных инструментов по России

Необходимо собрать информацию о действующих магазинах музыкальных инструментов по всей России. В приоритете точки, специализирующиеся на продаже роялей и пианино. Требуемый объем - не менее 2500 объектов.

Разработка VFX-эффектов для мобильной игры

Необходимо создать два процедурных шейдерных эффекта для казуальной мобильной игры: энергетическую дугу и центральный вихрь. Эффекты должны быть адаптивными и не перекрывать игровой интерфейс.