Size: a a a

RL reading group

2017 June 02

EZ

Evgenii Zheltonozhsk... in RL reading group
Подкину тоже пару статей
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
End-to-End Differentiable Adversarial Imitation Learning https://arxiv.org/abs/1612.02179 https://github.com/itaicaspi/mgail
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
Deep Reinforcement Learning: An Overview https://arxiv.org/abs/1701.07274
источник

P

Pavel Shvechikov in RL reading group
С видео все сложно. От ШАДа нам оператора не дадут, поэтому только если кто-то из добровольцев с камерой будет приходить и записывать (just like на семинарах Ветрова). Было бы круто, если такой человек появится, но в первую очередь хочется наладить постоянные встречи и качественный контент.
источник

P

Pavel Shvechikov in RL reading group
Evgenii Zheltonozhskii🇮🇱
Подкину тоже пару статей
Спасибо!
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
Pavel Shvechikov
С видео все сложно. От ШАДа нам оператора не дадут, поэтому только если кто-то из добровольцев с камерой будет приходить и записывать (just like на семинарах Ветрова). Было бы круто, если такой человек появится, но в первую очередь хочется наладить постоянные встречи и качественный контент.
видео было бы круто, к сожалению географически сложно на встречи попасть 😕😕
источник

PC

Pika Chu in RL reading group
Вообще можно тупо скринкастить.
источник

PC

Pika Chu in RL reading group
Канал на твиче и готово.
источник

PC

Pika Chu in RL reading group
источник
2017 June 03

EZ

Evgenii Zheltonozhsk... in RL reading group
Pika Chu
Вообще можно тупо скринкастить.
ну то что говорят не менее интересно, особенно в таком формате
источник
2017 June 06

EZ

Evgenii Zheltonozhsk... in RL reading group
Вот еще интересная статья, оптимизация архитектуры нейронной сети с помощью RL, но не на улучшение результатов, а на уменьшение computational cost
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
Learning Time-Efficient Deep Architectures with Budgeted Super Networks https://arxiv.org/abs/1706.00046
источник

P

Pavel Shvechikov in RL reading group
Evgenii Zheltonozhskii🇮🇱
Learning Time-Efficient Deep Architectures with Budgeted Super Networks https://arxiv.org/abs/1706.00046
Интересно. @EvgeniyZh, сможешь рассказать про нее 15 числа? Было бы круто ее представить на фоне https://openreview.net/forum?id=r1Ue8Hcxg
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
Pavel Shvechikov
Интересно. @EvgeniyZh, сможешь рассказать про нее 15 числа? Было бы круто ее представить на фоне https://openreview.net/forum?id=r1Ue8Hcxg
я бы с радостью, но геграфически никак
источник

P

Pavel Shvechikov in RL reading group
Жень, спасибо за статью, дописал ее в общий пул в гуглодоке.  Горячо приветствуются желающие рассказать о какой-нибудь статье из списка 15 июня, через неделю, в четверг! : )  Пишите, пожалуйста, если у Вас есть замечания / предложения / пожелания относительно темы выступления.
источник

BS

Boris Sharchilev in RL reading group
Привет! На всякий случай тоже закину идею про одну интересную, более теоретическую статью: A Connection between Generative Adversarial Networks, Inverse Reinforcement Learning, and Energy-Based Models, она про связь Inverse RL (когда по имеющимся сессиям нужно восстановить reward function) и GANы. Под капотом она больше про эквивалентность GAN и Energy-Based Models (EBM), но так как один из подходов к IRL - это MaxEnt IRL, частный случай EBM, то получаем связь. Из практических плюсов - сведение обучения IRL-модели к обучению GAN-ов, из теоретических - много интересных идей. Так как в ней много модных слов и вообще она про Inverse RL, про который как минимум на ШАДовском курсе не было, то, наверное, она не для первого раза, но мало ли, вдруг когда-нибудьпокажется интересной.
источник

BS

Boris Sharchilev in RL reading group
источник

P

Pavel Shvechikov in RL reading group
Круто! GANов становится еще больше : )  
Вот, например, неделю назад вышла статья Enhanced Experience Replay Generation for Efficient Reinforcement Learning  https://arxiv.org/abs/1705.08245
в которой ребята используют GAN для предварительной тренировки агента, чтобы ускорить обучение и слегка улушчить качество.  Есть GAN, который делает curriculum learning, есть GAN, который делает Imitation learning, есть GAN, который делает inverse RL.  
Нам надо однозначно устроить день GANов в RL.
источник

BS

Boris Sharchilev in RL reading group
Ага, тоже интересная штука. Ну и вообще GANы очень естественно ложатся на постановку RL, если думать о генераторе как об агенте (генерирует сессии), а о дискриминаторе - как о среде, которая дает награды. Так что буду ждать дня GANов :)
источник

P

Pavel Shvechikov in RL reading group
Добавлю, что про GANы в RL можно думать еще как об аналогии Generator=Actor, Discriminator=Critic (see  https://arxiv.org/abs/1610.01945).
источник