ИздательствоРечевые технологииВыпуск №1/2017

Чучупал В. Я.
Неявная модель произношения для автоматического распознавания речи




Материал не доступен

Вариативность произнесения слов в естественной разговорной речи является одним из основных источников ошибок при ее автоматическом распознавании. Примером подобной вариативности является пропуск или подмена отдельных звуков, вызванная неполной или нечеткой артикуляцией в быстрой речи.

В статье описана неявная модель произношения, которая реализована посредством сглаживания параметров акустических моделей соседних звуков.

Предлагается использовать контексто-зависимые параметры сглаживания, которые обусловлены текущим фонетическим, просодическим и языковым контекстом звуков. Хотя подход к моделированию вариативности произношения уже обсуждался в литературе, метод контексто-зависимого сглаживания моделей смежных звуков, насколько известно автору, пока не был представлен.

Эксперименты на речевом корпусе данных, который содержал как читаемую, так и естественную речь, показали корректность предложения использовать переменные параметры сглаживания, значение которых обусловлено фонетическим и просодическим контекстом.

Ключевые слова: автоматическое распознавание речи, обработка естественного языка, акустическое моделирование речи, модели вариативности произношения