Судхарсан Равичандиран

Глубокое обучение с подкреплением на Python. OpenAI Gym и TensorFlow для профи

бумажная книга
Проверить наличие на складах

Дата отгрузки на данный момент неизвестна.

Товар закончился у основного поставщика, и, после получения заказа от вас, мы закажем его у других поставщиков. Мы не можем гарантировать выполнение данного заказа, поэтому настоятельно не рекомендуем заказывать данный товар, используя предоплату (банковский перевод и т.п.). Заказ на такой товар действителен в течение 3 недель (если в течение 3 недель товар не придет, заказ будет отменен). Однако, это не означает, что товар нельзя заказать вновь, поскольку в некоторых случаях возможны и более поздние поставки.


Технические характеристики
Издательство:
Питер
Дата выхода:
август 2019
ISBN:
978-5-4461-1251-7
Объём:
320 страниц
Масса:
419 г
Размеры (В × Ш × Т):
24 × 17 см
Обложка:
мягкая
Бумага:
офсетная
Переводное издание:
+

Глубокое обучение с подкреплением (Reinforcement Learning) — самое популярное и перспективное направление искусственного интеллекта.

 

Практическое изучение RL на Python поможет освоить не только базовые, но и передовые алгоритмы глубокого обучения с подкреплением. Вы начнете с основных принципов обучения с подкреплением, OpenAI Gym и TensorFlow, познакомьтесь с марковскими цепями, методом Монте-Карло и динамическим программированием, так что «страшные» аббревиатуры DQN, DRQN, A3C, PPO и TRPO вскоре перестанут вас пугать.

 

Вы узнаете об агентах, которые учатся на человеческих предпочтениях, DQfD, HER и многих других последних достижениях RL. Прочитав книгу, вы приобретете знания и опыт, необходимые для реализации обучения с подкреплением и глубокого обучения с подкреплением в реальных проектах, и войдете в мир искусственного интеллекта.

 

В этой книге вы:

- Познакомитесь с основами методов, алгоритмов и элементов RL

- Обучите агента с помощью OpenAI Gym и Tensorflow

- Освоите марковские процессы принятия решений, оптимальность Беллмана и обучение TD

- Научитесь решать проблемы многоруких бандитов

- Овладеете алгоритмами глубокого обучения, такими как RNN, LSTM и CNN

- Создадите интеллектуальных агентов с помощью алгоритма DRQN, которые смогут играть в Doom

- С помощью DDPG научите агентов играть в Lunar Lander

- Отправите агента на автогонки, используя метод DQN



Полная версия

Мы принимаем
Подробнее об оплате

1996-2025 © OTALEX