Вот вообще не реклама ни разу! А хвала и почёт Сергею Иванову за его труды!
Он взял, и законспектировал всю основную теорию по RL. Попробовал скомпилировать в единое повествование материалы из нескольких основных курсов, чтобы детально объяснить, как устроены алгоритмы RL и почему они выглядят именно так, а не иначе.
Очень вероятно, что этот труд пригодится кому-нибудь для погружения в RL с нуля (от читателя предполагается только знание базового ML / DL).
В книге могут быть баги и ошибки (особенно в последней главе), поэтому если вдруг вы найдёте опечатки / неточности / некорректности - смело сообщайте, контакты есть собственно в файле :)
Вероятно, будут фиксы / обновления; актуальная версия будет здесь:
https://github.com/FortsAndMills/RL-Theory-book