Телеграмм чат группы theoreticalrl страница 2

С видео все сложно. От ШАДа нам оператора не дадут, поэтому только если кто-то из добровольцев с камерой будет приходить и записывать (just like на семинарах Ветрова). Было бы круто, если такой человек появится, но в первую очередь хочется наладить постоянные встречи и качественный контент.

источник

22:05пожаловаться #4

Pavel Shvechikov in RL reading group

Evgenii Zheltonozhskii🇮🇱

Подкину тоже пару статей

Спасибо!

источник

22:06пожаловаться #5

Evgenii Zheltonozhsk... in RL reading group

Pavel Shvechikov

видео было бы круто, к сожалению географически сложно на встречи попасть 😕😕

источник

22:39пожаловаться #6

Pika Chu in RL reading group

Вообще можно тупо скринкастить.

источник

23:57пожаловаться #7

Pika Chu in RL reading group

Канал на твиче и готово.

источник

23:57пожаловаться #8

Pika Chu in RL reading group

2017 June 03

Evgenii Zheltonozhsk... in RL reading group

Pika Chu

Вообще можно тупо скринкастить.

ну то что говорят не менее интересно, особенно в таком формате

источник

00:10пожаловаться #10

2017 June 06

Evgenii Zheltonozhsk... in RL reading group

Вот еще интересная статья, оптимизация архитектуры нейронной сети с помощью RL, но не на улучшение результатов, а на уменьшение computational cost

источник

10:06пожаловаться #11

Evgenii Zheltonozhsk... in RL reading group

Learning Time-Efficient Deep Architectures with Budgeted Super Networks https://arxiv.org/abs/1706.00046

источник

10:06пожаловаться #12

Pavel Shvechikov in RL reading group

Evgenii Zheltonozhskii🇮🇱

Learning Time-Efficient Deep Architectures with Budgeted Super Networks https://arxiv.org/abs/1706.00046

Интересно. @EvgeniyZh, сможешь рассказать про нее 15 числа? Было бы круто ее представить на фоне https://openreview.net/forum?id=r1Ue8Hcxg

источник

10:23пожаловаться #13

Evgenii Zheltonozhsk... in RL reading group

Pavel Shvechikov

я бы с радостью, но геграфически никак

источник

10:23пожаловаться #14

Pavel Shvechikov in RL reading group

Жень, спасибо за статью, дописал ее в общий пул в гуглодоке. Горячо приветствуются желающие рассказать о какой-нибудь статье из списка 15 июня, через неделю, в четверг! : ) Пишите, пожалуйста, если у Вас есть замечания / предложения / пожелания относительно темы выступления.

источник

10:48пожаловаться #15

Boris Sharchilev in RL reading group

Привет! На всякий случай тоже закину идею про одну интересную, более теоретическую статью: A Connection between Generative Adversarial Networks, Inverse Reinforcement Learning, and Energy-Based Models, она про связь Inverse RL (когда по имеющимся сессиям нужно восстановить reward function) и GANы. Под капотом она больше про эквивалентность GAN и Energy-Based Models (EBM), но так как один из подходов к IRL - это MaxEnt IRL, частный случай EBM, то получаем связь. Из практических плюсов - сведение обучения IRL-модели к обучению GAN-ов, из теоретических - много интересных идей. Так как в ней много модных слов и вообще она про Inverse RL, про который как минимум на ШАДовском курсе не было, то, наверное, она не для первого раза, но мало ли, вдруг когда-нибудьпокажется интересной.

источник

11:10пожаловаться #16

Boris Sharchilev in RL reading group

https://arxiv.org/abs/1611.03852

источник

11:10пожаловаться #17

Pavel Shvechikov in RL reading group

Круто! GANов становится еще больше : )
Вот, например, неделю назад вышла статья Enhanced Experience Replay Generation for Efficient Reinforcement Learning https://arxiv.org/abs/1705.08245
в которой ребята используют GAN для предварительной тренировки агента, чтобы ускорить обучение и слегка улушчить качество. Есть GAN, который делает curriculum learning, есть GAN, который делает Imitation learning, есть GAN, который делает inverse RL.
Нам надо однозначно устроить день GANов в RL.

источник

11:26пожаловаться #18

Boris Sharchilev in RL reading group

Ага, тоже интересная штука. Ну и вообще GANы очень естественно ложатся на постановку RL, если думать о генераторе как об агенте (генерирует сессии), а о дискриминаторе - как о среде, которая дает награды. Так что буду ждать дня GANов :)

источник

11:31пожаловаться #19

Pavel Shvechikov in RL reading group

Добавлю, что про GANы в RL можно думать еще как об аналогии Generator=Actor, Discriminator=Critic (see https://arxiv.org/abs/1610.01945).

источник

11:36пожаловаться #20