Рональд Митчелл

Скраппинг веб-сайтов с помощью Python

бумажная книга
20.81 USD В корзину
Проверить наличие на складах

Склад в Москве

Ожидаемое поступление (если вы сделаете заказ прямо сейчас): 14.12.2025; планируемая отправка: 15.12.2025

Склад в С.-Петербурге

Ожидаемое поступление (если вы сделаете заказ прямо сейчас): 17.12.2025; планируемая отправка: 18.12.2025


Технические характеристики
Издательство:
ДМК Пресс
Дата выхода:
апрель 2016
ISBN:
978-5-97060-223-2
Тираж:
200 экземпляров
Объём:
280 страниц
Масса:
295 г
Размеры (В × Ш × Т):
21 × 15 см
Обложка:
мягкая
Переводное издание:
Web Scraping with Python: Collecting Data from the Modern Web
Язык оригинала:
английский

Изучите методы скрапинга и краулинга веб-сайтов, чтобы получить доступ к неограниченному объему данных в любом уголке Интернета в любом формате. С помощью этого практического руководства вы узнаете, как использовать скрипты Python и веб-API, чтобы одновременно собрать и обработать данные с тысяч или даже миллионов веб-страниц.Идеально подходящая для программистов, специалистов по безопасности и веб-администраторов, знакомых с языком Python, книга знакомит не только с основными принципами работы веб-скраперов, но и углубляется в более сложные темы, такие, как анализ сырых данных или использование скраперов для тестирования интерфейса веб-сайта. Примеры программного кода, приведенные в книге, помогут разобраться в этих принципах на практике.

 

Прочитав эту книгу, вы научитесь:

 

- выполнять парсинг сложных HTML страниц;

- сканировать веб-страницы и сайты;

- работать с API;

- применять несколько методов хранения собранных данных;

- скачивать, обрабатывать и извлекать данные из документов;

- использовать инструменты и методы для очистки плохо отформатированных данных;

- читать и записывать естественные языки;

- выполнять краулинг с использованием регистрационных форм;

- выполнять скрапинг Javascript-кода;

- обрабатывать изображения и распознавать текст.

 

Инструменты и примеры, приведенные в этой книге, позволяют легко автоматизировать несколько повторяющихся задач, высвобождая время для решения более насущных проблем. Это легко читаемая, ориентированная на конкретный результат книга, рассказывающая о реальных проблемах и решениях. 



Полная версия

Мы принимаем
Подробнее об оплате

1996-2025 © OTALEX