20.19 USD
Наличие на складе:
Ожидаемое поступление (если вы сделаете заказ прямо сейчас): 19.11.2024; планируемая отправка: 20.11.2024
Ожидаемое поступление (если вы сделаете заказ прямо сейчас): 22.11.2024; планируемая отправка: 23.11.2024
Издательство: | BHV |
Дата выхода: | сентябрь 2022 |
ISBN: | 9785977568852 |
Объём: | 400 страниц |
Масса: | 529 г |
Книга посвящена промышленно-ориентированному применению обучения с подкреплением (Reinforcement Learning, RL). Объяснено, как обучать промышленные и научные системы решению любых пошаговых задач методом проб и ошибок – без подготовки узкоспециализированных учебных множеств данных и без риска переобучить или переусложнить алгоритм. Рассмотрены марковские процессы принятия решений, глубокие Q-сети, градиенты политик и их вычисление, методы устранения энтропии и многое другое. Данная книга – первая на русском языке, где теоретический базис RL и алгоритмы даны в прикладном, отраслевом ключе.