Мэтью Топол

Apache Arrow. Обработка больших данных в оперативной памяти

Name: Apache Arrow. Обработка больших данных в оперативной памяти
Price: 2931.86 RUB
Availability: InStock
ISBN: 978-5-93700-273-0

бумажная книга

41.93 USD В корзину

Проверить наличие на складах

Склад в Москве

Ожидаемое поступление (если вы сделаете заказ прямо сейчас): 13.01.2026; планируемая отправка: 14.01.2026

Склад в С.-Петербурге

Ожидаемое поступление (если вы сделаете заказ прямо сейчас): 16.01.2026; планируемая отправка: 17.01.2026

💸 Продать эту книгу

Технические характеристики

Издательство:

ДМК

Дата выхода:

март 2025

ISBN:

978-5-93700-273-0

Объём:

410 страниц

Масса:

750 г

Размеры (В × Ш × Т):

24 × 17 см

Обложка:

твёрдая

Бумага:

офсетная

Аннотация

Apache Arrow – это программная платформа с открытым исходным кодом, предназначенная для разработки приложений, эффективно выполняющих обработку и анализ табличных данных за счет размещения в оперативной памяти. В обновленном втором издании представлен обзор формата Arrow с акцентом на его преимуществах и универсальности.Эта книга познакомит вас с форматами обмена и хранения данных и расскажет о взаимосвязи Arrow с Parquet, Protocol Buffers, FlatBuffers, JSON и CSV. Вы откроете для себя подпроекты Apache Arrow, включая Flight, SQL, Database Connectivity и nanoarrow, и освоите интеграцию с популярными системами обработки аналитических данных Snowflake, Dremio и DuckDB. В заключительных главах приводятся реальные примеры и описания продуктов на базе Apache Arrow.

Вы научитесь:

использовать библиотеки Apache Arrow;
обеспечивать эффективное производство и потребление данных Apache Arrow;
применять вычислительный механизм Arrow Асего для выполнения сложных операций;
создавать серверы и клиенты Arrow Flight для быстрой передачи данных;
создавать библиотеки Arrow в локальном режиме и распространять их в сообществе.

Желательны базовые знания концепций анализа данных. В книге представлены многочисленные примеры исходного кода на языках C++, Python и Go.

Издание предназначено разработчикам, инженерам и научным работникам, занятым в обработке данных и желающим в полной мере изучить и использовать функциональные возможности Apache Arrow. Независимо от того, создаете ли вы утилиты для анализа данных и механизмов запросов или формируете полнофункциональные конвейеры для обработки табличных данных, эта книга поможет вам организовать работу на любом языке программирования. Программисты и исследователи найдут в ней рекомендации по выбору оптимальной среды для достижения целевых задач приложения, а также по управлению большими данными и их анализу.

Разделы каталога