Size: a a a

RL reading group

2017 May 13

P

Pavel Shvechikov in RL reading group
источник

P

Pavel Shvechikov in RL reading group
@nikishin_evg Напиши потом, пожалуйста, как что-нибудь выберешь из статей. Я добавлю тебя в табличку.
источник

EN

Evgenii Nikishin in RL reading group
да, я как раз сейчас выбираю
источник

EN

Evgenii Nikishin in RL reading group
я бы взял «Neural Episodic Control»
источник

P

Pavel Shvechikov in RL reading group
Хорошо, записал.
источник
2017 May 20

c

cydoroga in RL reading group
Ну раз уже есть статьи, можно возьму curiosity driven exploration by selfsupervised prediction?
источник

P

Pavel Shvechikov in RL reading group
Хорошо, записал тебя, Паш!
источник

c

cydoroga in RL reading group
Спасибо!
источник

P

Pavel Shvechikov in RL reading group
Ссылка на расписание https://docs.google.com/spreadsheets/d/1ZeL1_mfR1ccwKKO_ihKs6R26pqy5bsJgU_t3jJjSN5c/edit#gid=1738423751

Рекомендация к подготовке статей:  было бы здорово освещая статью (1) постраться максимально осветить необычные / нестандартные подходы, на которой она строится (2) заглянуть в реализацию (если она есть) и попытаться донести до аудитории принципиальные сложности в практическом применении нового метода (3) донести до аудитории практические хаки, которые необходимы, чтобы метод заработал (к сожалению, они встречаются в статьях часто и очень часто без полного их списка не работает приблизительно ничего)
источник
2017 May 23

P

Pavel Shvechikov in RL reading group
Одна из первых статей по использованию генеративных моделей в RL: GAN генерирует цели для агента
https://arxiv.org/pdf/1705.06366.pdf
источник
2017 May 26

P

Pavel Shvechikov in RL reading group
OpenAI зарелизили бейзлайны базовых алгоритмов. ПОка доступны только 3 реинкарнации DQN, но задумка классная, давно пора.
https://blog.openai.com/openai-baselines-dqn/
источник
2017 June 02

AG

Artem Grachev in RL reading group
Всем привет. А летом семинар соответственно будет?
источник

P

Pavel Shvechikov in RL reading group
Да, будет
источник

AG

Artem Grachev in RL reading group
И вопрос насчёт пропусков для людей не связанных с Яндексом или связанных как-то слабо?
источник

AG

Artem Grachev in RL reading group
Я полагаю, что хорошо бы организовать такую же систему как на спецсеминаре Ветрова
источник

P

Pavel Shvechikov in RL reading group
Да, пропуска будут, я предполагал сделать так же, как на спецсеме Ветрова.
Про пропуска и форму их выдачи напишу чуть позже.
источник

SK

Sergey Kolesnikov in RL reading group
про архив и хорошие практики: а можно в будущем ссылки кидать на abs?
источник

P

Pavel Shvechikov in RL reading group
да, хорошо  : )
источник

P

Pavel Shvechikov in RL reading group
@Scitator поправил все ссылки на abs
источник

SK

Sergey Kolesnikov in RL reading group
о, спасибо)
источник