Глубокое обучение с подкреплением. AlphaGo и другие технологии

Name: Глубокое обучение с подкреплением. AlphaGo и другие технологии
Price: 1225.36 RUB
Availability: InStock
Author: Максим Лапань
ISBN: 978-5-4461-1079-7

бумажная книга

17.52 USD В корзину

Проверить наличие на складах

Склад в Москве

Ожидаемое поступление (если вы сделаете заказ прямо сейчас): 16.12.2025; планируемая отправка: 17.12.2025

Склад в С.-Петербурге

Ожидаемое поступление (если вы сделаете заказ прямо сейчас): 19.12.2025; планируемая отправка: 20.12.2025

💸 Продать эту книгу

Технические характеристики

Издательство:

Питер

Серия:

Для профессионалов

Дата выхода:

ноябрь 2019

ISBN:

978-5-4461-1079-7

Объём:

496 страниц

Масса:

645 г

Размеры (В × Ш × Т):

24 × 17 см

Обложка:

мягкая

Бумага:

офсетная

Аннотация

Эта книга ─ подробное руководство по новейшим инструментам DL и их ограничениям. Вы оцените на практике такие методы, как кросс-энтропия и градиенты по стратегиям, а затем научитесь применять их. Поупражняетесь и с коллекцией виртуальных игр от Atari, и с современными фаворитами, например Connect4. Максим Лапан подготовил прекрасное введение в тему RL, чтобы вы научились программировать интеллектуальные самообучающиеся агенты, способные решать колоссальное множество прикладных задач. Начните внедрять Q-обучение в средах класса grid world, обучите вашего агента торговать на бирже, узнайте, как модели обработки естественного языка привели к взрывному распространению чат-ботов.

В этой книге:

• Вы узнаете, какое место в контексте DL занимают методы RL, реализуете сложные модели глубокого обучения

• Освоите базовый уровень RL: марковские процессы принятия решений

• Оцените различные методы RL, в частности кросс-энтропию, DQN, модель актора-критика, TRPO, PPO, DDPG, D4PG и др.

• Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах

• Научитесь побеждать в аркадных играх Atari, используя обучение с подкреплением

• Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента

• Научите вашего агента играть в Connect4, воспользовавшись методом AlphaGo Zero

• Познакомитесь с новейшими исследованиями в области глубокого обучения, касающимися разработки чат-ботов

Разделы каталога