17.31 USD
Наличие на складе:
Ожидаемое поступление (если вы сделаете заказ прямо сейчас): 28.11.2024; планируемая отправка: 29.11.2024
Ожидаемое поступление (если вы сделаете заказ прямо сейчас): 01.12.2024; планируемая отправка: 02.12.2024
Издательство: | ДМК Пресс |
Дата выхода: | январь 2017 |
ISBN: | 978-5-97060-459-5 |
Тираж: | 200 экземпляров |
Объём: | 280 страниц |
Масса: | 350 г |
Размеры(В x Ш x Т), см: | 21 x 15 |
Обложка: | мягкая |
Бумага: | офсетная |
Всё, что регистрирует человек и созданные им машины, может считаться данными. Фиксируя новое и переводя архивы в цифровую форму, мы с каждым днём производим всё больше данных. Но гораздо чаще случается так, что данные разбросаны по всемирной сети на многочисленных страницах онлайновых магазинов, заметках в социальных сетях, логах серверов и т.п. Прежде чем начать работать с такими данными, их необходимо собрать и сохранить в пригодном для анализа виде. Решению этих вопросов и посвящена данная книга.
Основной материал книги разделён на две части. В первой части дано краткое введение в R - описание среды разработки, языка и основных пакетов-расширений. Вторая часть посвящена непосредственно сбору данных: работе с открытыми данными, извлечению данных из веб-страниц и из социальных сетей. Также рассмотрены необходимые технические вопросы: протокол HTTP, функции импорта данных различных форматов и регулярные выражения. Завершается рассказ созданием карт на основе собранных данных.
Издание предназначено специалистам по анализу данных, а также программистам, интересующихся сбором данных в Интернете.