ИздательствоРечевые технологииВыпуск №1/2019

Харламов А. А.
Нейросетевой подход к распознаванию ситуации по тексту

 
Материал в открытом доступе

Аннотация. Как правило, отдельный текст описывает отдельную ситуацию. Поэтому можно с достаточной степень уверенности соотнести описание ситуации с самой ситуацией. Далее, конкретный текст может быть представлен несколькими способами. Одним из них является формирование семантической сети текста, которая, теперь уже, будет представлять упомянутую ситуацию. Однородная семантическая сеть — это граф, вершины которого представляют собой понятия, а дуги указывают на степень близости этих понятий. Для ее построения используется модель искусственной нейронной сети на основе нейроподобных элементов с временной суммацией сигналов (так называемая кортикоморфная ассоциативная память). Выявление ключевых вершин сети (переранжирование) осуществляется с использованием хопфилдоподобного алгоритма. Используя ассоциативную сеть как представление внутренней структуры текста, мы можем сравнивать тексты по структуре. То есть, что мы можем сравнивать тексты по смыслу, сравнивая между собой их ассоциативные сети. Таким образом, мы можем сравнивать ситуации: чем больше степень пересечения ассоциативных сетей текстов, описывающих ситуации, тем более похожи представленные ими ситуации. Пусть мы имеем множество ситуаций, описанных текстами, которое некоторым образом раскластеризовано на несколько подмножеств. Каждое из этих подмножеств представляет класс ситуаций, чем-то похожих друг на друга. Мы можем решить задачу классификации (распознавания) ситуации, используя алгоритм сравнения сети распознаваемой ситуации с сетями классов.

Ключевые слова: распознавание ситуации, классификация ситуаций, семантическая сеть, сравнение семантических сетей, сравнение смыслов текстов, смысловая классификация текстов, искусственная нейронная сеть, нейроподобный элемент с временной суммацией сигналов, переранжирование понятий семантической сети.

A NEURAL NETWORK APPROACH TO THE SITUATION RECOGNITION BASED ON THE TEXTS

Kharlamov A. A., Doctor of Technical Sciences, Senior Researcher, Institute of Higher Nervous Activity RAS, Moscow, Professor, Department of Applied and Experimental Linguistics, MSLU, Moscow, Professor, School of Software Engineering HSE, Moscow

Abstract. Generally, an individual text describes an individual situation. That is why it is possible to correlate a situation with its description with a high degree of certainty. Then, the content of an individual text may be represented in several ways. One of them is the construction of a semantic network of the text. In this case the network will represent the situation. The so called homogeneous semantic network is a graph which nodes represent some concepts and the arcs show the proximity of the concepts within an analyzed structure. If the network is formed as a result of some text analysis then its nodes are the text concepts. For its construction a model of an artificial neural network of neural-like elements with temporal summation (this is so called corticomorphic associative memory) was used as its basis. The nodes ranking is performed by a Hopfield-like algorithm. Thus we can compare the sense of texts by comparing their structure: the larger is the area of the intersection of the associative networks of the texts, the more alike are the represented situations. If there is a set of situations clustered into a set of subsets in some way, then the situations of each subset are included into the situation class with some common features. All the situations of each class resemble each other. Thus, the classification problem may be solved by using the algorithm of comparison between the network of the analyzed situation and those of situation classes.

Keywords: situation recognition, situation classification, semantic network, semantic networks comparison, semantic texts comparison, semantic texts classification, artificial neuronetworks, neuroliked element based on temporal signal summation, semantic network concept rearrangement.