Издательство: | Книга по требованию |
Дата выхода: | январь 2011 |
ISBN: | 978-3-8433-1756-6 |
Объём: | 148 страниц |
На протяжении последних десятилетий наблюдается стремительный рост количества и объёмов коллекций полнотекстовых документов, например, фонды электронных библиотек, электронные архивы журнальных статей, собрания научно-технических материалов и другие коллекции, доступные пользователю в локальных или глобальных сетях. Одной из важнейших задач становится создание программных средств, предоставляющих пользователю эффективные механизмы поиска. В работе рассмотрены вопросы построения информационно-поисковой системы на основе механизма автоматической классификации полнотекстовых документов. Изложены подходы и алгоритмы формирования образов документов и их кластеризации, а также оценки полученного разбиения. Предложен метод автоматического формирования рубрикатора коллекции документов в виде, унаследованном от традиционного библиотечного предметного рубрикатора. Проверена работоспособность метода на небольших коллекциях, содержащих русскоязычные документы различного размера и содержания. Данная работа может быть полезной студентам и аспирантам технических специальностей.