Data mining. Извлечение информации из Facebook, Twitter, LinkedIn, Instagram, GitHub

Data mining. Извлечение информации из Facebook, Twitter, LinkedIn, Instagram, GitHub

Мэтью А. Расселл Михаил Классен

     

бумажная книга



Издательство: Питер
Серия: Бестселлеры O`Reilly
Дата выхода: август 2019
ISBN: 978-5-4461-1246-3
Объём: 464 страниц
Масса: 605 г
Размеры(В x Ш x Т), см: 24 x 17
Обложка: мягкая
Бумага: офсетная
Переводное издание +

В недрах популярных социальных сетей — Twitter, Facebook, LinkedIn и Instagram — скрыты богатейшие залежи информации. Из этой книги исследователи, аналитики и разработчики узнают, как извлекать эти уникальные данные, используя код на Python, Jupyter Notebook или контейнеры Docker. Сначала вы познакомитесь с функционалом самых популярных социальных сетей (Twitter, Facebook, LinkedIn, Instagram), веб-страниц, блогов и лент, электронной почты и GitHub. Затем приступите к анализу данных на примере Twitter.

 

Прочитайте эту книгу, чтобы

• Узнать о современном ландшафте социальных сетей

• Научиться использовать Docker, чтобы легко оперировать кодами, приведенными в книге;

• Узнать, как адаптировать и поставлять код в открытый репозиторий GitHub;

• Научиться анализировать собираемые данные с использованием возможностей Python 3;

• Освоить продвинутые приемы анализа, такие как TFIDF, косинусное сходство, анализ словосочетаний, определение клика и распознавание образов;

• Узнать, как создавать красивые визуализации данных с помощью Python и JavaScript.

 

Мэтью Рассел (Matthew Russell) — директор Built Technologies, он возглавляет команду лидеров, работающую над улучшением нашего мира. Вне работы Мэтью рациональный индивидуалист, готовящийся к возможному зомби-апокалипсису.

 

Михаил Классен (Mikhail Klassen) — главный специалист по обработке и анализу данных в Paladin AI, стартапе, занимающемуся адаптивными технологиями обучения. Он увлекается проблемами искусственного интеллекта и анализом данных. Когда Михаил не занят на работе, он любит читать и путешествовать.