Издательство — Речевые технологии — Выпуск №1/2019 Аннотация. Как правило, отдельный текст описывает отдельную ситуацию. Поэтому можно с достаточной степень уверенности соотнести описание ситуации с самой ситуацией. Далее, конкретный текст может быть представлен несколькими способами. Одним из них является формирование семантической сети текста, которая, теперь уже, будет представлять упомянутую ситуацию. Для того чтобы такое представление оказалось эффективным, необходимо автоматизировать процесс построения семантической сети. В работе представлен способ описания текста с помощью однородной семантической сети. Для начала покажем, что текст может быть представлен неоднородной семантической сетью. Не вызывает сомнений, что отдельные предложения текста могут быть представлены в графическом виде расширенными предикатными структурами. Если мы соберем все расширенные предикатные структуры текста воедино, отождествив соответствующие вершины, мы получим граф, представляющий смысл этого текста. Убрав разметку дуг неоднородной семантической сети, мы получим однородную (ассоциативную) семантическую сеть. Семантические сети представляют статику ситуации. Если же мы выйдем за рамки собственно семантической сети, то легко смоделируем и динамику ситуации тоже. Для этого нам надо построить не одну, а несколько семантических сетей, каждая на своем корпусе текстов, описывающем ситуацию позавчера, вчера, сегодня. Соединив их одноименные вершины, мы получим полное представление о динамике ситуации. Однородная семантическая сеть, сформированная автоматически, таким образом, может быть удобным инструментом для анализа ситуаций. Ключевые слова: sсемантическая сеть текста как модель ситуации, текст как модель ситуации, Расширенная предикатная структура предложения, семантическая структура текста, однородная (ассоциативная) семантическая сеть, тематическая структура текста, анализ динамики ситуации, инструментарий для автоматического анализа текста. TEXT SEMANTIC NETWORK AS A SITUATION MODEL Kharlamov A. A., Doctor of Technical Sciences, Senior Researcher, Institute of Higher Nervous Activity RAS, Moscow, Professor, Department of Applied and Experimental Linguistics, MSLU, Moscow, Professor, School of Software Engineering HSE, Moscow Abstract. As a rule an individual text describes an individual situation. Then it is possible to correlate a situation with its description with a high degree of certainty. Any text can be represented by several ways. One of them is to form a semantic network from the text [1] which, in its turn, will represent the situation described by the text. To make the representation more efficient the semantic network should be formed automatically. This paper presents a way of describing a text with a homogenous semantic network, formed from the text. First of all, we will show that any text may be represented as a non-homogeneous semantic network. It is clear that separate sentences of the text may be represented as a graph by extended predicate structures. If we combine all of the extended predicate structure graphs of all sentences of the text and match the corresponding graphs nodes, we will get a graph representing the text semantics. If we remove arc annotation in a non-homogeneous network we will get a homogeneous (associative) semantic network. A homogeneous semantic network can be obtained automatically by text analysis. Actually, a semantic network is inherently a static representation of the situation, but if we go beyond the semantic network we can easily model the situation dynamics. For this we construct more than one semantic network using several text corpora which describe the situation the day before yesterday, yesterday, today. If we connect their similarly-named nodes we will get the situation dynamic representation. A homogeneous semantic network, formed automatically, may represent the structure (the semantics) of a text. That is why a tool for automatic analysis of the text semantics is an instrument of the analysis of situations. Keywords: semantic text network as a situation model, text as a situation model, extended predicate structure of sentences, semantic structure of text, homogenous (associative) semantic network, text thematic structure, situation dynamics analysis, situation automatic analysis tool. | ||
© 2015 – 2024. Издательский дом «Народное образование»
|