ИздательствоРечевые технологииВыпуск №3/2010

Уплисова К. О.
Акустические признаки гласных звуков с негармонической структурой

 
Материал в открытом доступе

Человек различает звуки речи независимо от того, произнесены ли они человеком или птицей, голосом или шёпотом, пропеты или синтезированы. Однако в зависимости от способа генерации, акустические характеристики фонем могут существенно отличаться. Шёпотная речь и звуки, имитируемые птицами, по большей части, не являются гармоническими, а обладают широкополосной структурой. Исследование мощности спектральных компонентов в различных частотных полосах для гласных звуков серого попугая и шёпотной речи выявило их относительное сходство. Для определения ключевых частот, необходимых для идентификации звуков «у», «о», «а», «и», исследована возможность идентификации синтезированных одноформантных шумоподобных звуков: фрагментов белого шума с усиленной на 35 дБ узкой полосой частот. Если полоса находилась в диапазоне от 200 до 500 Гц, звук идентифицировался как «у», 700-900 Гц — «о», 1000–1700 — «а», и если усиленная по амплитуде частота превышала 1900 Гц, звук идентифицировался как «и». Таким образом, на основании первого и единственного максимума в спектре возможно идентифицировать четыре категории гласных. При сравнении значений выраженных спектральных компонентов гласных звуков серого попугая и шёпотных гласных в диапазонах частот, соответствующих полученным при идентификации синтезированных звуков, оказалось, что у всех звуков присутствуют выраженные спектральные компоненты в соответствующих зонах. В связи с этим можно предположить, что для идентификации гласных категорий «у», «о», «а», «и» необходимо и достаточно наличия выраженных спектральных компонентов в определённой частотной зоне. Выраженные спектральные максимумы вне этих зон могут не оказывать влияния на идентификацию категории гласного звука.