ИздательствоРечевые технологииВыпуск №4/2008

Цирульник Л. И., Гецевич Ю. С.
Алгоритмы преобразования сложноструктурированных объектов для синтеза речи по тексту

 
Материал в открытом доступе

Одним из путей расширения использования систем синтеза речи является обработка и озвучивание не только текстовой информации, но и сложноструктурированных объектов, таких как таблицы, рисунки, формулы и т.д. Преобразование подобных объектов в орфографический текст является частным случаем задачи анализа сцен, но требует создания специальных алгоритмов, учитывающих структуру обрабатываемых объектов. При этом критерием корректности созданных алгоритмов должна являться, по мнению авторов, не только достоверность полученной информации, но и адекватность смыслового восприятия сформированного орфографического текста. В работе рассматриваются сложноструктурированные объекты MS Word, предлагается шкала оценок сложноструктурированных объектов по критерию их сложности для смыслового восприятия, приводятся алгоритмы преобразования таких объектов в орфографический текст, описываются особенности программной реализации разработанных алгоритмов.