Телеграмм чат группы theoreticalrl страница 249

Size: a a a

RL reading group

1226 membersпожаловаться на группу

2021 October 07

Vadim Liventsev in RL reading group

да

источник

12:30пожаловаться #1

Vadim Liventsev in RL reading group

можно даже просто прийти и провести свой)

источник

12:31пожаловаться #2

Boris in RL reading group

https://arxiv.org/abs/1905.09275

источник

13:37пожаловаться #3

Sergey Sviridov in RL reading group

источник

13:43пожаловаться #4

pa_antya in RL reading group

К примеру было бы интересно послушать про подобное))

https://www.facebook.com/722677142/posts/10157795590962143/

https://ashish-kmr.github.io/rma-legged-robots/rma-locomotion-final.pdf?fbclid=IwAR3eihHSktHblpMGpaGfjKjUa_82k63W5SnrQ5_aGJS-pGsvA2pKkMpbg6M

источник

14:05пожаловаться #5

2021 October 08

Rena Rena in RL reading group

Гайз, привет!
Меня зовут Рената и с активном поиске ментора по RL. У меня есть игра под тип тетриса или пятнашек, куча данных как играют реальные люди и желание прикрутить RL.

На данном моменте у меня средний уровень понимания процессов и это кажется основным затыком, чтобы что-то начать делать.

Планирую 1-2 встречи в неделю, возможно иногда помощь с кодом. По цене - договоримся. Если вы думали, что вам не хватает в жизни подавана, возможно, это знак)))

источник

01:18пожаловаться #6

АК

Алексей Клоков... in RL reading group

энвайрмент есть?

источник

02:16пожаловаться #7

Rena Rena in RL reading group

Неа(

источник

02:26пожаловаться #8

See All in RL reading group

See All in RL reading group

TLDR: RL moments

источник

02:31пожаловаться #10

АК

Алексей Клоков... in RL reading group

добро пожаловать в offline RL)

источник

02:35пожаловаться #11

АК

Алексей Клоков... in RL reading group

я тоже пытаюсь применять offline RL в своем пет-проекте (https://github.com/Laggg/ml-bots-surviv.io). Кажется, мы +- в одинаковом положении. Я бы предложил что-то заботать и обсудить, кто-что понял/у кого-что получилось завести. Я не претендую на роль ментора по RL, но схема с обсуждением, кажется, рабочая. Как тебе @RenataNerenata?

GitHub

GitHub - Laggg/ml-bots-surviv.io

Contribute to Laggg/ml-bots-surviv.io development by creating an account on GitHub.

источник

02:39пожаловаться #12

pa_antya in RL reading group

Из какого должна состоять команда RL?
На что будет тратится больше времени у людей занимающихся RL?

Поделитесь пожалуйста своим мнением и что думаете об этом. Есть ощущение, что деятельность rl специалиста несколько отличается от ml/ds специалистов, которые не заниматься rl

источник

12:33пожаловаться #13

Konstantin Sozykin in RL reading group

не думаю, что отличается так уж сильно

источник

13:52пожаловаться #14

Andrey Isachenko in RL reading group

Наверное наиболее заметное отличие - это то что у тебя данные не из датасета статического какого-то, а из симулятора будут поступать или железа какого-то. Ну и из моего опыта какой-то приличный кусок работы займет то что бы наладить интеграцию с этим самым симулятором. Ну если это что-то стандартное типа openai gym, то проще канешн. А остальное кажется +- тоже самое - ковыряешь модель, запускаешь, смотришь графики

источник

14:00пожаловаться #15

ЕК

Евгений Кормин... in RL reading group

источник

15:10пожаловаться #16

АК

Андрей Квасов... in RL reading group

С учетом датасета из реальны игроков, я бы начал с простого алгоритма из imitation learning, хотя бы behaviour cloning. Дальше крутить Rl: online/offline

источник

17:20пожаловаться #17

АК

Андрей Квасов... in RL reading group

И действительно - удобство симулятора исключает очень даже большую часть мучений.

источник

17:22пожаловаться #18

Petr Kuderov in RL reading group

Рената, а глобально цель какая?

источник

17:23пожаловаться #19

Rena Rena in RL reading group

научить агента играть на уровне человека, если вы конкретно про задачу

источник

18:14пожаловаться #20