Обучение с подкреплением

Р.С. Саттон Э.Дж. Барто

Обложка:


Вступительное слово
Предисловие ко второму изданию
Предисловие к первому изданию
Обозначения
От издательства
Глава 1. Введение
Часть I. ТАБЛИЧНЫЕ МЕТОДЫ РЕШЕНИЯ
Глава 2. Многорукие бандиты
Глава 3. Конечные марковские процессы принятия
решений
Глава 4. Динамическое программирование
Глава 5. Методы Монте-Карло
Глава 6. Обучение на основе временных различий
Глава 7. n-шаговый бутстрэппинг
Глава 8. Планирование и обучение табличными
методами
Часть II. ПРИБЛИЖЕННЫЕ МЕТОДЫ РЕШЕНИЯ
Глава 9. Предсказание с единой стратегией и
аппроксимацией
Глава 10. Управление с единой стратегией и
аппроксимацией
Глава 11. Методы с разделенной стратегией и
аппроксимацией
Глава 12. Следы приемлемости
Глава 13. Методы градиента стратегии
Часть III. ЗАГЛЯНЕМ ПОГЛУБЖЕ
Глава 14. Психология
Глава 15. Нейронауки
Глава 16. Примеры и приложения
Глава 17. Передовые рубежи
Предметный указатель