В ближайшую пятницу 24.09 в 16:00 состоится открытый семинар лаборатории нейронных сетей и глубокого обучения МФТИ. Приглашаю всех, кого интересует тема на стыке rl и нейробиологии присоединяться :)
Ссылка для подключения -
https://us02web.zoom.us/j/82065813002?pwd=U0R6S1AvVXNJSGY1UFVHRXFYWGh3dz09Докладчик: Сергей Шуваев, МФТИ, Cold Spring Harbor Laboratory
ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ В МОДЕЛЯХ МОТИВИРОВАННОГО ПОВЕДЕНИЯ
Решения, принимаемые животными и человеком, зависят не только от стимулов окружающей среды, но также от внутренних физиологических и психологических состояний организма, совокупно известных как мотивация. Многие аспекты мотивации получили детальное описание, но моделирование влияния мотивационных состояний на стратегии животных, необходимое для корректной интерпретации поведенческих данных, пока существует только в виде концепций. Для построения численной модели мотивации, мы отталкиваемся от теоретических и экспериментальных данных в задачах питания из истощаемых источников – детально изученном случае влияния внутреннего состояния субъектов на поведенческие стратегии. Мы показываем, что решения животных в этих задачах могут быть объяснены модуляцией функции вознаграждения, при которой будущие вознаграждения рассматриваются относительно краткосрочного среднего уровня прошлых вознаграждений. Такая модуляция вознаграждения позволяет эффективно учитывать динамику параметров окружающей среды; она порождается обучением с подкреплением и согласуется с активностью дофаминергических нейронов в вентральной тегментальной области мозга. Распространение модели на более общий случай множественных мотиваций показало, что мотивация в моделях глубокого обучения с подкреплением может порождать многоцелевые непрерывные поведения, которые подстраиваются под потребности организма без переучивания. Поскольку выбор действий у человека и животных зависит от состояний сытости, бодрствования и т.д., включение мотивации в расчёт действия позволит точнее интерпретировать естественные поведения.
https://proceedings.neurips.cc/paper/2020/hash/da97f65bd113e490a5fab20c4a69f586-Abstract.htmlhttps://www.frontiersin.org/articles/10.3389/fnsys.2020.609316/full