Язык R в задачах науки о данных: импорт, подготовка, обработка, визуализация и моделирование данных

Язык R в задачах науки о данных: импорт, подготовка, обработка, визуализация и моделирование данных

Хэдли Уикем Гарретт Гроулмунд

     

бумажная книга



Издательство: Вильямс/Диалектика
Серия: Несерийные
Дата выхода: декабрь 2018
ISBN: 978-5-9909446-8-8
Объём: 592 страниц
Масса: 1062 г
Размеры(В x Ш x Т), см: 24 x 17
Обложка: твёрдая
Переводное издание: R for Data Science. Import, Tidy, Transform, Visualize, and Model Data
Язык оригинала: английский

Овладейте искусством превращения необработанных первичных данных в плодотворные догадки, гипотезы и новые знания с помощью языка R.

Эта книга задумана как введение в вычислительную среду R, среду разработки RStudio и библиотеку tidyverse - коллекцию пакетов, совместное использование которых обеспечивает быстроту и легкость анализа данных. Книга ориентирована на читателей, не имеющих предварительного опыта программирования, и предназначена для того, чтобы помочь им в как можно более короткие сроки начать решать задачи науки о данных.Авторы книги познакомят вас со всеми стадиями процесса анализа данных, включая импорт, предварительную подготовку, разведочный анализ и моделирование данных, а также демонстрацию результатов. Прочитав книгу, вы получите цельное представление как о процессе анализа данных в целом, так и об основных инструментах, используемых при его проведении.

Основные темы книги:

Предварительная обработка данных - преобразование наборов данных к виду, удобному для анализа.

 Программирование - освоение мощных инструментов R, упрощающих анализ данных и делающих его более понятным.

Разведочный анализ - исследование данных, выдвижение и быстрая проверка гипотез.

Моделирование - предоставление сжатых сводных данных, отражающих выявленные тенденции в наборе данных.

Обмен информацией - изучение языка R Markdown, обеспечивающего интеграцию описательного текста, кода и результатов анализа.

 

Хэдли Уикем - старший научный сотрудник компании RStudio и член организации R Foundation.К числу его разработок относятся пакеты для науки о данных (библиотека tidyverse: ggplot2, dplyr, tidyr, purrr, readr и др.) и инструментальные средства разработки пакетов (roxygen2, testthat, devtools).Гарретт Гроулмунд - специалист в области статистики, преподаватель и главный инструктор компании RStudio. Он автор известного пакета lubridate, а также книги Hands-On Programming with R.

Каталог