ИздательствоРечевые технологииВыпуск №3/2010

Ронжин А. Л., Будков В. Ю.
Система протоколирования дикторов на базе алгоритма определения речевой активности в многоканальном аудиопотоке

 
Материал в открытом доступе

Рассматривается система многоканальной записи и последующего анализа речи участников мероприятий в интеллектуальном зале. Предложен комплекс алгоритмов для выделения границ фраз в многоканальном аудиопотоке, записанном встроенными микрофонами веб-камер, расположенных на конференц-столе перед каждым участником. Выбранный в ходе экспериментов алгоритм позволяет достичь приемлемого качества выделения границ фраз и автоматически выбирать номер камеры текущего активного диктора.