26.37 USD
Наличие на складе:
Ожидаемое поступление (если вы сделаете заказ прямо сейчас): 01.01.2025; планируемая отправка: 02.01.2025
Ожидаемое поступление (если вы сделаете заказ прямо сейчас): 04.01.2025; планируемая отправка: 05.01.2025
Издательство: | Питер |
Серия: | Бестселлеры O``Reilly |
Дата выхода: | июнь 2024 |
ISBN: | 978-601-08-4037-9 |
Объём: | 288 страниц |
Масса: | 462 г |
Размеры(В x Ш x Т), см: | 24 x 17 x 2 |
Обложка: | мягкая |
Место в рейтинге продаж: | 180 |
Вы получили два разных, но связанных между собой набора данных? Что делать? Какие инструменты использовать для поиска совпадений? А если все, что у вас есть, — это доступ к базе данных с помощью запроса SQL SELECT? Джим Лемер познакомит вас с лучшими практиками, техниками и хитрыми приемами, которые помогут импортировать, очищать, сопоставлять, оценивать и осмысливать разнородные данные с помощью SQL.
Администраторы баз данных, разработчики, бизнес-аналитики и специалисты data science узнают, как выявлять и удалять дубликаты, парсить строки, извлекать данные из XML и JSON, упорядочивать данные, а также работать над качеством данных и выполнять операции ETL для поиска сходств и различий между разными представлениями одинаковых данных.
Примеры в книге содержат реальные кейсы и рабочий код.