18.33 USD
Наличие на складе:
Ожидаемое поступление (если вы сделаете заказ прямо сейчас): 30.11.2024; планируемая отправка: 01.12.2024
Ожидаемое поступление (если вы сделаете заказ прямо сейчас): 03.12.2024; планируемая отправка: 04.12.2024
Издательство: | ДМК Пресс |
Дата выхода: | январь 2016 |
ISBN: | 978-5-97060-331-4 |
Тираж: | 200 экземпляров |
Объём: | 264 страниц |
Масса: | 312 г |
Размеры(В x Ш x Т), см: | 21 x 15 |
Обложка: | мягкая |
Бумага: | офсетная |
Переводное издание | + |
Язык оригинала: | английский |
Применение различных практических методик для систематизации и извлечения полезной текстовой информации из неструктурированных данных с использованием языка программирования Java.
Обработка естественного языка (Natural Language Procession — NLP) представляет собой важную область разработки прикладного ПО и, с учётом современных задач ИТ, в будущем эта важность будет только возрастать. Уже сейчас наблюдается рост потребности в приложениях, работающих с естественными языками на основе NLP-методик.
В книге «Использование Java для обработки естественного языка» рассматриваются способы организации автоматической обработки текста с применением таких методик, как полнотекстовый поиск, правильное распознавание имён, кластеризация, извлечение информации и составление аннотаций. Концепции обработки естественного языка излагаются таким образом, что даже читатели, не обладающие знаниями об этой технологии и о методах статистического анализа, смогут понять их.
Если вы программируете на языке Java и хотите узнать о решениях элементарных задач, составляющих основу обработки естественного языка, то эта книга для вас. Вы научитесь выбирать и практически применять базовые методики обработки естественного языка для выполнения многих элементарных задач, а также включать их в реальные приложения, решающих более сложные, комплексные задачи. Читатель должен обладать некоторым опытом разработки программ на языке Java.
Эта книга поможет:
глубоко понять сущность основных задач обработки естественного языка и их взаимосвязи друг с другом;
изучить и практически использовать доступные механизмы токенизации;
реализовать методики определения границ предложений;
освоить применение специальных методик поиска имён людей и прочих именованных объектов в документе;
реализовать решения для определения морфологической разметки приложений;
научиться использовать синтаксические анализаторы для определения взаимосвязей между элементами документа;
объединить элементарные задачи в эффективную цепочку, способную решать более сложные и объёмные задачи обработки естественного языка.