20.37 USD
Наличие на складе:
Ожидаемое поступление (если вы сделаете заказ прямо сейчас): 28.11.2024; планируемая отправка: 29.11.2024
Ожидаемое поступление (если вы сделаете заказ прямо сейчас): 01.12.2024; планируемая отправка: 02.12.2024
Издательство: | ДМК Пресс |
Серия: | Профессиональное программирование |
Дата выхода: | декабрь 2018 |
ISBN: | 978-5-97060-576-9 |
Тираж: | 100 экземпляров |
Объём: | 656 страниц |
Масса: | 765 г |
Размеры(В x Ш x Т), см: | 21 x 14 x 4 |
Обложка: | мягкая |
Бумага: | офсетная |
Иллюстрированное издание | + |
"Книга "Изучаем Spark" занимает первые позиции в моем списке рекомендаций для тех, кто желает познакомиться с этим популярным фреймворком с целью создания приложений для обработки огромных объемов данных" - Бен Лорика (Ben Lorica), ведущий специалист по работе с данными, O'Reilly Media
Объем обрабатываемых данных во всех областях человеческой деятельности продолжает расти быстрыми темпами. Существуют ли эффективные приемы работы с ним? В этой книге рассказывается об Apache Spark, открытой системе кластерных вычислений, которая позволяет быстро создавать высокопроизводительные программы анализа данных.
C помощью Spark вы сможете манипулировать огромными объемами данных посредством простого API на Python, Java и Scala. Написанная разработчиками Spark, эта книга поможет исследователям данных и программистам быстро включиться в работу. Она расскажет, как организовать параллельное выполнение заданий всего несколькими строчками кода, и охватывает примеры от простых пакетных приложений до программ, осуществляющих обработку потоковых данных и использующих алгоритмы машинного обучения.
С помощью этой книги вы: познакомитесь с особенностями Spark, такими как распределенные наборы данных, кэширование в памяти и интерактивные оболочки; изучите мощные встроенные библиотеки Spark, включая Spark SQL, Spark Streaming и MLlib; научитесь пользоваться единой парадигмой программирования вместо смеси инструментов, таких как Hive, Hadoop, Mahout и Storm; узнаете, как развертывать интерактивные, пакетные и потоковые приложения; исследуете возможности использования разных источников данных, включая HDFS, Hive, JSON и S3; овладеете продвинутыми приемами программирования на основе Spark, такими как разделение данных на разделы и применение совместно используемых переменных.