Size: a a a

RL reading group

2018 March 30

DM

Dmitry Mittov in RL reading group
норм, но устаешь быстро
источник

AP

Anton Pechenko in RL reading group
Танцоры часто так перемещаются. И да даже за это получают повышенный реворд
источник

МК

Максим Кузнецов... in RL reading group
Опа дрица гоп ца ца а сегодня пятница
источник

SK

Sergey Kolesnikov in RL reading group
@чат во славу популяризации RL есть следующее предложение....

вводная:
- мы делаем разбор статей по RL через презентации и доклады
- ods делает разбор статей по DL через хабропосты

предложние:
почему бы по окончании доклада не подготавливать краткую выжимку, аля article essence из ods и, собственно,  выкладывать потом на хабр мини-обзоры еще и по RL?
источник

АС

Артём С in RL reading group
Мини-обзоры вместе с видосами
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
Aleksey Grinchuk
А никто не пробовал? Может так норм передвигаться?
источник
2018 April 01

IK

Ivan Kush in RL reading group
Sergey Kolesnikov
@чат во славу популяризации RL есть следующее предложение....

вводная:
- мы делаем разбор статей по RL через презентации и доклады
- ods делает разбор статей по DL через хабропосты

предложние:
почему бы по окончании доклада не подготавливать краткую выжимку, аля article essence из ods и, собственно,  выкладывать потом на хабр мини-обзоры еще и по RL?
а логотип будет :D
источник

IK

Ivan Kush in RL reading group
источник
2018 April 02

МК

Максим Кузнецов... in RL reading group
надо, чтобы он dab делал
источник

МК

Максим Кузнецов... in RL reading group
источник

АС

Артём С in RL reading group
dab is so 2015
источник

АК

Андрей Квасов... in RL reading group
Пост про Population Based Training. Принцип для поиска оптимальных  гиперпараметров в deep learning.
https://vk.com/wall-914531

Population based training(PBT) uses a similar approach to random search by randomly sampling hyperparameters and weight initializations. Differently from the traditional approach, PBT runs each training asynchronously and evaluates its performance periodically. If a model in the population is under-performing, it will leverage the rest of the model population and replacing itself with a more optimal model. At the same time, PBT explores new hyperparameters by modifying the better model’s hyperparameters, before training is continued.
источник
2018 April 03

📒

📒 in RL reading group
В WordlModels написали "To train our V model, we first collect a dataset of 10,000 random rollouts in the environment."
Это значит 10к игр сыграли или 10к фреймов собрали?
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
📒
В WordlModels написали "To train our V model, we first collect a dataset of 10,000 random rollouts in the environment."
Это значит 10к игр сыграли или 10к фреймов собрали?
думаю игр
источник

📒

📒 in RL reading group
просто тогда одна игра с рандомной политикой идет 1000 фреймов, и в итоге получается 10миллионов фреймов примерно 100гигов данных,
чтобы обучить VAE..
источник

c

cydoroga in RL reading group
Андрей Квасов
Пост про Population Based Training. Принцип для поиска оптимальных  гиперпараметров в deep learning.
https://vk.com/wall-914531

Population based training(PBT) uses a similar approach to random search by randomly sampling hyperparameters and weight initializations. Differently from the traditional approach, PBT runs each training asynchronously and evaluates its performance periodically. If a model in the population is under-performing, it will leverage the rest of the model population and replacing itself with a more optimal model. At the same time, PBT explores new hyperparameters by modifying the better model’s hyperparameters, before training is continued.
Это чем-то отличается от эволюционных стратегий? Звучит похоже оч
источник

📒

📒 in RL reading group
📒
просто тогда одна игра с рандомной политикой идет 1000 фреймов, и в итоге получается 10миллионов фреймов примерно 100гигов данных,
чтобы обучить VAE..
Написал Хардмару он пояснил:
источник

📒

📒 in RL reading group
источник

📒

📒 in RL reading group
Попробую тогда с 1к обучить но даже это много кажется для VAE
источник

SZ

Sergei Zhgirovski in RL reading group
Pavel Shvechikov
Если вдруг у вас горит от мультиагентов и вы хотите выиграть nips challenge
https://www.pommerman.com/
А здесь что-нибудь мешает использовать не RL, а какие-нибудь ручные эвристики?
источник