Analysis of short unstructured documents using fuzzy significance scales and special procedures for economic information integration

Analysis of short unstructured documents using fuzzy significance scales and special procedures for economic information integration

Т. Какатунова О. Булыгина П. Козлов

     

электронная книга



Дата выхода: декабрь 2019
Размер файла: 271 Кб

В статье предложен новый подход к автоматическому анализу коротких сообщений, поступающих на Интернет-порталы и электронную почту органов государственной власти. Разработанная модель позволяет выполнять классификацию коротких неструктурированных текстовых документов при недостатке статистической информации и слабой степени пересечения тематических рубрик. Входными данными для алгоритма построения модели является множество рубрик и обучающая выборка, а его результатом являются нечеткие весовые коэффициенты значимых слов тезаурусов рубрик, что обеспечивает корректное представление характеристик документа и работу алгоритма рубрицирования (классификации).

Каталог