Натан Марц Джеймс Уоррен

Большие данные. Руководство. Принципы и практика построения масштабируемых систем обработки данных в реальном времени

бумажная книга
Проверить наличие на складах

Дата отгрузки на данный момент неизвестна.

Товар закончился у основного поставщика, и, после получения заказа от вас, мы закажем его у других поставщиков. Мы не можем гарантировать выполнение данного заказа, поэтому настоятельно не рекомендуем заказывать данный товар, используя предоплату (банковский перевод и т.п.). Заказ на такой товар действителен в течение 3 недель (если в течение 3 недель товар не придет, заказ будет отменен). Однако, это не означает, что товар нельзя заказать вновь, поскольку в некоторых случаях возможны и более поздние поставки.


Технические характеристики
Издательство:
Вильямс/Диалектика
Серия:
Несерийные
Дата выхода:
декабрь 2017
ISBN:
978-5-8459-2075-1
Тираж:
500 экземпляров
Объём:
368 страниц
Масса:
600 г
Размеры (В × Ш × Т):
24 × 17 см
Обложка:
твёрдая
Переводное издание:
+
Язык оригинала:
английский

В этой книге представлены теоретические основы организации систем больших данных и поясняется, каким образом они воплощаются на практике. В ней рассматривается лямбда-архитектура, предназначенная для построения подобных систем, и на примере конкретного веб-приложения поясняются особенности реализации всех уровней этой архитектуры с помощью инструментальных средств вроде Hadoop, Cassandra и Storm. Для чтения этой книги не требуется предварительное знакомство с особенностями анализа крупномасштабных данных или баз данных типа NoSQL, хотя полезно знать о традиционных базах данных.

Книга рассчитана на читателей, стремящихся освоить принципы построения систем больших данных и внедрить их на практике.

В крупномасштабных веб-приложениях, которые поддерживают работу социальных сетей, выполняют аналитику в реальном времени или поддерживают электронную торговлю, приходится обрабатывать большие массивы данных, объем и скорость обмена которыми превышают возможности информационных систем, основанных на традиционных базах данных. Для подобных приложений требуются архитектуры, в основе которых лежат кластеры машин для хранения и обработки данных любого объема и с любой скоростью. Правда, масштабируемость и простота не являются взаимоисключающими свойствами подобных архитектур.

Эта книга поможет читателю научиться строить системы больших данных, используя архитектуру, специально предназначенную для фиксации и анализа данных в масштабе веб.

В ней представлена простая для понимания и масштабируемая лямбда-архитектура, позволяющая разрабатывать информационные системы усилиями небольших команд. В книге даются теоретические основы организации систем больших данных и поясняется, каким образом они воплощаются на практике. Помимо общей инфраструктуры для обработки больших данных, читатель может ознакомиться с конкретными технологическими и инструментальными средствами вроде Hadoop, Storm и баз данных типа NoSQL.

В этой книге рассматриваются следующие темы.

Введение в системы больших данных.

Описание особенностей обработки данных масштаба веб в реальном времени.

Применение инструментальных средств вроде Hadoop, Cassandra и Storm.

Возможность расширить свои знания и навыки за пределы традиционных баз данных.

 

Для чтения этой книги не требуется предварительное знакомство с особенностями анализа крупномасштабных данных или баз данных типа NoSQL, хотя полезно знать о традиционных базах данных.

 

Об авторах

Натан Марц — создатель системы Apache Storm и инициатор применения лямбда-архитектуры для построения систем больших данных.

Джеймс Уоррен — архитектор-аналитик с квалификацией в области машинного обучения и научных расчетов.

 

Отзывы о книге

 "Эта книга выходит за рамки отдельных инструментальных средств или платформ. Обязательна к прочтению всем, кто работает системами больших данных".

—Джонатан Эстерхази, компания Groupon

 

"Эта книга — подробный, снабженный примерами экскурс в лямбда-архитектуру под руководством ее изобретателя".

—Марк Фишер, компания Pivotal

 

"Книга содержит мудрость, которую можно приобрести только после выполнения многих проектов с большими данными. Обязательна для чтения".

—Педро Феррера Бертран, компания Datasalt

 

"Это фактическое руководство по рационализации обработки конвейера данных пакетами и почти в реальном времени".

—Алекс Холмс, автор книги Hadoop in Practice



Полная версия

Мы принимаем
Подробнее об оплате

1996-2025 © OTALEX