12.71 USD
Наличие на складе:
Ожидаемое поступление (если вы сделаете заказ прямо сейчас): 01.12.2024; планируемая отправка: 02.12.2024
Ожидаемое поступление (если вы сделаете заказ прямо сейчас): 04.12.2024; планируемая отправка: 05.12.2024
Издательство: | BHV-СПб |
Серия: | O``RELLY |
Дата выхода: | март 2024 |
ISBN: | 978-601-09-2561-8 |
Объём: | 256 страниц |
Масса: | 251 г |
Размеры(В x Ш x Т), см: | 21 x 14 |
Книга посвящена передовым методам построения конвейеров данных, сбору данных из множества разнообразных источников и преобразованию их для аналитики. Дано введение в конвейеры данных, раскрыта их работа в современном стеке данных. Описаны стандартные шаблоны конвейеров данных. Показан процесс сбора данных от их извлечения до загрузки в хранилище. Затронуты вопросы преобразования и проверки данных, оркестровки конвейеров, методов их обслуживания и мониторинга производительности. Примеры программ написаны на Python и SQL и задействуют множество библиотек с открытым исходным кодом.
Сбор данных из множества разнообразных источников и преобразование их для использования в контексте задачи — вот где кроется разница между наличием данных и получением от них реальной пользы. Этот карманный справочник дает определение конвейеров данных и объясняет, как они работают в современном стеке данных.
Вы познакомитесь с общими соображениями и ключевыми моментами принятия решений при реализации конвейеров, таких как пакетный или потоковый прием данных, а также выбор между разработкой и покупкой инструментов. В книге рассматриваются наиболее распространенные решения, принимаемые специалистами по данным, и обсуждаются основополагающие концепции, применимые к платформам с открытым исходным кодом, коммерческим продуктам и к собственным разработкам.