ИздательствоРечевые технологииВыпуск №1/2017

Бирин Д. А., Булашевич А. Е., Грекис М. Ю.
Задача автоматической расстановки знаков пунктуации в распознанной спонтанной русской речи




Материал не доступен

Основная цель процесса распознавания речи — получение на выходе удобочитаемого, ясного текста. В русском языке это практически невозможно без знаков препинания. Проблема в том, что существующая система правил пунктуации была разработана для письменного языка. В спонтанной речи эти правила часто не соблюдаются и даже нарушаются. Кроме того, для спонтанной речи характерны такие явления, которые не описаны в правилах, сформулированных для литературного (письменного) языка, поскольку эти явления там практически отсутствуют (например, хезитационный поиск, самоисправления и т.д.). Таким образом, задача заключается в том, чтобы адаптировать классические правила для спонтанной речи и разработать систему автоматической пунктуации, которая сможет превратить последовательность распознанных слов спонтанной речи в понятный письменный текст. На данном этапе наша система позволяет в большинстве случаев однозначно определять границы предложения и с определённой точностью ставить внутренние знаки препинания.

Ключевые слова: распознавание спонтанной речи, пунктуация в спонтанной речи, автоматическая расстановка знаков препинания.