30.98 USD
Наличие на складе:
Ожидаемое поступление (если вы сделаете заказ прямо сейчас): 01.12.2024; планируемая отправка: 02.12.2024
Ожидаемое поступление (если вы сделаете заказ прямо сейчас): 04.12.2024; планируемая отправка: 05.12.2024
Издательство: | Питер |
Серия: | Для профессионалов |
Дата выхода: | ноябрь 2019 |
ISBN: | 978-5-4461-1079-7 |
Объём: | 496 страниц |
Масса: | 645 г |
Размеры(В x Ш x Т), см: | 24 x 17 |
Обложка: | мягкая |
Бумага: | офсетная |
Эта книга ─ подробное руководство по новейшим инструментам DL и их ограничениям. Вы оцените на практике такие методы, как кросс-энтропия и градиенты по стратегиям, а затем научитесь применять их. Поупражняетесь и с коллекцией виртуальных игр от Atari, и с современными фаворитами, например Connect4. Максим Лапан подготовил прекрасное введение в тему RL, чтобы вы научились программировать интеллектуальные самообучающиеся агенты, способные решать колоссальное множество прикладных задач. Начните внедрять Q-обучение в средах класса grid world, обучите вашего агента торговать на бирже, узнайте, как модели обработки естественного языка привели к взрывному распространению чат-ботов.
В этой книге:
• Вы узнаете, какое место в контексте DL занимают методы RL, реализуете сложные модели глубокого обучения
• Освоите базовый уровень RL: марковские процессы принятия решений
• Оцените различные методы RL, в частности кросс-энтропию, DQN, модель актора-критика, TRPO, PPO, DDPG, D4PG и др.
• Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах
• Научитесь побеждать в аркадных играх Atari, используя обучение с подкреплением
• Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента
• Научите вашего агента играть в Connect4, воспользовавшись методом AlphaGo Zero
• Познакомитесь с новейшими исследованиями в области глубокого обучения, касающимися разработки чат-ботов