Телеграмм чат группы theoreticalrl страница 77

@чат во славу популяризации RL есть следующее предложение....

вводная:
- мы делаем разбор статей по RL через презентации и доклады
- ods делает разбор статей по DL через хабропосты

предложние:
почему бы по окончании доклада не подготавливать краткую выжимку, аля article essence из ods и, собственно, выкладывать потом на хабр мини-обзоры еще и по RL?

источник

15:43пожаловаться #4

АС

Артём С in RL reading group

Мини-обзоры вместе с видосами

источник

15:45пожаловаться #5

EZ

Evgenii Zheltonozhsk... in RL reading group

Aleksey Grinchuk

А никто не пробовал? Может так норм передвигаться?

источник

16:10пожаловаться #6

2018 April 01

IK

Ivan Kush in RL reading group

Sergey Kolesnikov

@чат во славу популяризации RL есть следующее предложение....

вводная:
- мы делаем разбор статей по RL через презентации и доклады
- ods делает разбор статей по DL через хабропосты

предложние:
почему бы по окончании доклада не подготавливать краткую выжимку, аля article essence из ods и, собственно, выкладывать потом на хабр мини-обзоры еще и по RL?

а логотип будет :D

источник

12:02пожаловаться #7

IK

Ivan Kush in RL reading group

источник

12:02пожаловаться #8

2018 April 02

МК

Максим Кузнецов... in RL reading group

Ivan Kush

надо, чтобы он dab делал

источник

16:11пожаловаться #9

МК

Максим Кузнецов... in RL reading group

источник

16:11пожаловаться #10

АС

Артём С in RL reading group

dab is so 2015

источник

18:01пожаловаться #11

АК

Андрей Квасов... in RL reading group

Пост про Population Based Training. Принцип для поиска оптимальных гиперпараметров в deep learning.
https://vk.com/wall-914531

Population based training(PBT) uses a similar approach to random search by randomly sampling hyperparameters and weight initializations. Differently from the traditional approach, PBT runs each training asynchronously and evaluates its performance periodically. If a model in the population is under-performing, it will leverage the rest of the model population and replacing itself with a more optimal model. At the same time, PBT explores new hyperparameters by modifying the better model’s hyperparameters, before training is continued.

источник

18:41пожаловаться #12

2018 April 03

📒

📒 in RL reading group

В WordlModels написали "To train our V model, we first collect a dataset of 10,000 random rollouts in the environment."
Это значит 10к игр сыграли или 10к фреймов собрали?

источник

03:07пожаловаться #13

EZ

Evgenii Zheltonozhsk... in RL reading group

📒

В WordlModels написали "To train our V model, we first collect a dataset of 10,000 random rollouts in the environment."
Это значит 10к игр сыграли или 10к фреймов собрали?

думаю игр

источник

03:08пожаловаться #14

📒

📒 in RL reading group

просто тогда одна игра с рандомной политикой идет 1000 фреймов, и в итоге получается 10миллионов фреймов примерно 100гигов данных,
чтобы обучить VAE..

источник

03:10пожаловаться #15

c

cydoroga in RL reading group

Андрей Квасов

Пост про Population Based Training. Принцип для поиска оптимальных гиперпараметров в deep learning.
https://vk.com/wall-914531

Population based training(PBT) uses a similar approach to random search by randomly sampling hyperparameters and weight initializations. Differently from the traditional approach, PBT runs each training asynchronously and evaluates its performance periodically. If a model in the population is under-performing, it will leverage the rest of the model population and replacing itself with a more optimal model. At the same time, PBT explores new hyperparameters by modifying the better model’s hyperparameters, before training is continued.

Это чем-то отличается от эволюционных стратегий? Звучит похоже оч

источник

11:53пожаловаться #16

📒

📒 in RL reading group

📒

просто тогда одна игра с рандомной политикой идет 1000 фреймов, и в итоге получается 10миллионов фреймов примерно 100гигов данных,
чтобы обучить VAE..

Написал Хардмару он пояснил:

источник

11:56пожаловаться #17

📒

📒 in RL reading group