Райан Митчелл

Парсинг с помощью Python. Веб-скрапинг в действии

бумажная книга
Проверить наличие на складах

Дата отгрузки на данный момент неизвестна.

Товар закончился у основного поставщика, и, после получения заказа от вас, мы закажем его у других поставщиков. Мы не можем гарантировать выполнение данного заказа, поэтому настоятельно не рекомендуем заказывать данный товар, используя предоплату (банковский перевод и т.п.). Заказ на такой товар действителен в течение 3 недель (если в течение 3 недель товар не придет, заказ будет отменен). Однако, это не означает, что товар нельзя заказать вновь, поскольку в некоторых случаях возможны и более поздние поставки.


Технические характеристики
Издательство:
BHV-СПб
Серия:
O’Reilly
Дата выхода:
декабрь 2024
ISBN:
978-601-08-4570-1
Объём:
352 страниц
Масса:
553 г
Размеры (В × Ш × Т):
24 × 17 × 2 см
Обложка:
мягкая
Бумага:
офсетная

Парсинг с помощью Python. Веб-скрапинг в действии Если программирование — магия, то веб-скрапинг — настоящее колдовство. Написав простую автоматизированную программу, можно отправлять запросы веб-серверам, получать ответы с данными, а затем анализировать эти данные и извлекать необходимую информацию. Это обновленное третье издание книги не только познакомит вас с веб-скрапингом, но и послужит исчерпывающим руководством по сбору практически любых видов данных в современном Интернете. В части I основное внимание уделено механике веб-скрапинга: как с помощью Python отправлять запросы веб-серверам, обрабатывать ответы и автоматизировать взаимодействие с сайтами. В части II исследуются более конкретные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинга.

 

Книга покажет, как:

• анализировать сложные HTML-страницы;

• разрабатывать веб-сканеры с помощью фреймворка Scrapy;

• хранить данные, полученные с помощью скрапинга;

• читать и извлекать данные из документов;

• очищать и нормализовывать плохо отформатированные данные;

• читать и записывать информацию на естественных языках;

• выполнять поиск по формам и страницам входа;

• выполнять скрапинг JavaScript-кода и работать с API;

• писать и использовать программы для преобразования изображений в текст;

• обходить противоскрапинговые ловушки и блокаторы ботов;

• тестировать свои веб-сайты с помощью скрапинга.



Полная версия

1996-2026 © OTALEX OÜ

×

Выберите регион