Орёл, решка, ребро... Зависла

2019-07-05 13:13:38

Тот, что работал с результатами испытаний или анализировал данные опросов, знает, что на диаграмме сразу видно, где произошла ошибка ввода, сбойнул прибор, сотрудник ввёл данные «от фонаря» или посетители «накрутили голоса». Пользователю хотелось бы, чтобы программа отсекала такие исходные данные. Программисту же это - лишняя головная боль, поскольку такая обработка требует более глубокого знания теории вероятности и статистических методов. К тому же для подобной обработки массивов информации чаще используют язык R с пакетами JAGS и BUGS.

 

it190705_020

 

Вероятностные методы в программировании не так страшны, как «их малюют», - утверждает канадский специалист по работе с BigData Кэмерон Дэвидсон-Пайлон. Он сам использует и предлагает другим более распространённую, понятную и гибкую альтернативу R - Python с модулем PyMC и библиотеками NumPy, SciPy и Matplotlib. Их применению посвящена книга «Вероятностное программирование на Python: байесовский вывод и алгоритмы».

 

С математической точки зрения, выпадающие из диаграммы данные являются отклонением от нормального распределения и могут быть вычислены. Но на практике приходится обрабатывать не только численные значения, но и текстовые. Как к ним приложить формулу Байеса? Автор имеет большой опыт работы с интернет-магазинами (в частности, Shopify), поэтому приводимые им практические решения касаются приложения байесовских методов определения вероятности какого-либо события и расчета погрешностей к рейтингованию товаров, сортировке, ранжированию комментариев и т.п. Книга содержит базовые знания, постепенно - от простого к сложному - помогая освоить новый инструментарий и подводя к решению практических задач.

 

Пособие Кэмерона Дэвидсон-Пайлона «Вероятностное программирование на Python: байесовский вывод и алгоритмы» вышло в «Библиотеке программиста» издательства «Питер»

Комментарии

Оставить комментарий