Райан Митчелл

Современный скрапинг веб-сайтов с помощью Python

бумажная книга
Проверить наличие на складах

Дата отгрузки на данный момент неизвестна.

Товар закончился у основного поставщика, и, после получения заказа от вас, мы закажем его у других поставщиков. Мы не можем гарантировать выполнение данного заказа, поэтому настоятельно не рекомендуем заказывать данный товар, используя предоплату (банковский перевод и т.п.). Заказ на такой товар действителен в течение 3 недель (если в течение 3 недель товар не придет, заказ будет отменен). Однако, это не означает, что товар нельзя заказать вновь, поскольку в некоторых случаях возможны и более поздние поставки.


Технические характеристики
Издательство:
Питер
Серия:
Head First O``Reilly
Дата выхода:
февраль 2021
ISBN:
978-5-4461-1693-5
Объём:
336 страниц
Масса:
445 г
Размеры (В × Ш × Т):
24 × 17 × 2 см
Обложка:
мягкая
Бумага:
офсетная

Если программирование напоминает волшебство, то веб-скрапинг — это очень сильное колдунство. Написав простую автоматизированную программу, можно отправлять запросы на веб-серверы, запрашивать с них данные, а затем анализировать их и извлекать необходимую информацию. Новое расширенное издание книги знакомит не только с веб-скрапингом, но и поможет собрать любого вида данные в современном Интернете.

В части I основное внимание уделено механике веб-скрапинга: как с помощью Python запрашивать информацию с веб-сервера, производить базовую обработку серверного отклика и организовать автоматизированное взаимодействие с сайтами. В части II исследованы более специфичные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинга.

- Разбирайте сложные HTML-страницы.

- Разрабатывайте поисковые роботы с помощью фреймворка Scrapy.

- Изучайте методы хранения данных, полученных с помощью скрапинга.

- Считывайте и извлекайте данные из документов.

- Очищайте и нормализуйте плохо отформатированные данные.

- Читайте и пишите информацию на естественных языках.

- Освойте поиск по формам и логинам.

- Изучите скрапинг JavaScript и работу с API.

- Используйте и пишите программы для преобразования изображений в текст.

- Учитесь обходить скрапинговые ловушки и блокаторы ботов.

- Протестируйте собственный сайт с помощью скрапинга.



Полная версия

Мы принимаем
Подробнее об оплате

1996-2025 © OTALEX