Medusa: Performante Textstatistiken auf grossen Textmengen. Kookkurrenzanalyse in Theorie und Anwendung

Medusa: Performante Textstatistiken auf grossen Textmengen. Kookkurrenzanalyse in Theorie und Anwendung

Marco Buechler

     

бумажная книга



Издательство: Книга по требованию
Дата выхода: июль 2011
ISBN: 978-3-6390-1125-8
Объём: 128 страниц
Масса: 215 г
Размеры(В x Ш x Т), см: 23 x 16 x 1

Mit dem exponentiellen Wachstum der zur Verfugung stehenden Daten im Internet, wachst auch das darin gespeicherte Wissen. Ziel dieser Arbeit ist, verschiedene statistische Verfahren zur Extraktion von semantischen und syntaktischen Beziehungen zwischen Wortern zu vergleichen. Dabei werden neben klassischen Kookurrenzen auch die distanzabhangigen Kookkurrenzen eingefuhrt. Diese Aufgaben setzen grosse Datenmengen voraus. Um dies auch auf mehrere Millionen Satze anwenden zu konnen, werden performante Datenstrukturen benotigt. Weiterhin werden einige Heuristiken fur das performante Speichern von mehreren Milliarden Kookkurrenz-Datensatzen vorgestellt und deren Auswirkungen gemessen.

Данное издание не является оригинальным. Книга печатается по технологии принт-он-деманд после получения заказа.

Каталог