Size: a a a

RL reading group

2021 October 07

VL

Vadim Liventsev in RL reading group
да
источник

VL

Vadim Liventsev in RL reading group
можно даже просто прийти и провести свой)
источник

B

Boris in RL reading group
источник

SS

Sergey Sviridov in RL reading group
источник

p

pa_antya in RL reading group
источник
2021 October 08

RR

Rena Rena in RL reading group
Гайз, привет!
Меня зовут Рената и с активном поиске ментора по RL. У меня есть игра под тип тетриса или пятнашек, куча данных как играют реальные люди и желание прикрутить RL.

На данном моменте у меня средний уровень понимания процессов и это кажется основным затыком, чтобы что-то начать делать.

Планирую 1-2 встречи в неделю, возможно иногда помощь с кодом. По цене - договоримся. Если вы думали, что вам не хватает в жизни подавана, возможно, это знак)))
источник

АК

Алексей Клоков... in RL reading group
энвайрмент есть?
источник

RR

Rena Rena in RL reading group
Неа(
источник

SA

See All in RL reading group
источник

SA

See All in RL reading group
TLDR: RL moments
источник

АК

Алексей Клоков... in RL reading group
добро пожаловать в offline RL)
источник

АК

Алексей Клоков... in RL reading group
я тоже пытаюсь применять offline RL в своем пет-проекте (https://github.com/Laggg/ml-bots-surviv.io). Кажется, мы +- в одинаковом положении. Я бы предложил что-то заботать и обсудить, кто-что понял/у кого-что получилось завести. Я не претендую на роль ментора по RL, но схема с обсуждением, кажется, рабочая. Как тебе @RenataNerenata?
источник

p

pa_antya in RL reading group
Из какого должна состоять команда RL?
На что будет тратится больше времени у людей занимающихся RL?

Поделитесь пожалуйста своим мнением и что думаете об этом. Есть ощущение, что деятельность rl специалиста несколько отличается от ml/ds специалистов, которые не заниматься rl
источник

KS

Konstantin Sozykin in RL reading group
не думаю, что отличается так уж сильно
источник

AI

Andrey Isachenko in RL reading group
Наверное наиболее заметное отличие - это то что у тебя данные не из датасета статического какого-то, а из симулятора будут поступать или железа какого-то. Ну и из моего опыта какой-то приличный кусок работы займет то что бы наладить интеграцию с этим самым симулятором. Ну если это что-то стандартное типа openai gym, то проще канешн. А остальное кажется +- тоже самое - ковыряешь модель, запускаешь, смотришь графики
источник

ЕК

Евгений Кормин... in RL reading group
++
источник

АК

Андрей Квасов... in RL reading group
С учетом датасета из реальны игроков, я бы начал с простого алгоритма из imitation learning, хотя бы behaviour cloning. Дальше крутить Rl: online/offline
источник

АК

Андрей Квасов... in RL reading group
И действительно - удобство симулятора исключает очень даже большую часть мучений.
источник

PK

Petr Kuderov in RL reading group
Рената, а глобально цель какая?
источник

RR

Rena Rena in RL reading group
научить агента играть на уровне человека, если вы конкретно про задачу
источник