Телеграмм чат группы theoreticalrl страница 253

сап чат,
вместе с @vkurenkov ищем ресечеров и студентов на темы связанные с Offline RL, RecSys.RL, RecSys
цель - публикации
подробности - лучше в личке, это ж не _jobs
:thanks:

источник

23:49пожаловаться #6

2021 November 18

it

igor tokarev in RL reading group

⚡ — Начинаем семинар, присоединяйтесь! https://youtu.be/aD5aONXrYzA

YouTube

Семинар 9. Обзор работ по многоагентному обучению с подкреплением с конференций IJCAI и NeurIPS 2021

Осенницй цикл семинаров 2021 Центра Когнитивного Моделирования МФТИ.
Проводится еженедельно по четвергам в 17.00.

Программа семинаров: https://cogmodel.mipt.ru/seminars-autumn-2021
Семинар №9 от 18.11.2021.
Обзор работ по многоагентному обучению с подкреплением с конференций IJCAI и NeurIPS 2021 | Алексей Скрынник

Поговорим про работы по многоагентному обучению с подкреплением с ведущих конференций. На IJCAI работ по MARL было не очень много, но они достаточно практичные: применение MARL для торговли энергией и управления автобусами.

Конференция NeurIPS 2021 еще не началась, но список принятых статей уже известен, мы выберем и посмотрим интересные работы по MARL и подумаем над вопросами для их авторов.

Слайды: tba

Магистратура и аспирантура по ИИ и робототехнике с повышенной стипендией: https://cogmodel.mipt.ru/applicants
Группа ВК: https://vk.com/cogmodel
Телеграм: https://t.me/cogmodel

Наши семинары открытые - приглашаем принять участие всех желающих. Если у вас есть тема, котоая укладывается в наши…

источник

17:59пожаловаться #7

it

igor tokarev in RL reading group

Сейчас идёт

источник

17:59пожаловаться #8

2021 November 28

АС

Агент Сейлз... in RL reading group

видео недоступно

источник

18:21пожаловаться #9

AK

Arseny Kuznetsov in RL reading group

https://www.youtube.com/watch?v=sjvPYw0sUEg

YouTube

Семинар 9. Обзор работ по многоагентному обучению с подкреплением с конференций IJCAI и NeurIPS 2021

Осенницй цикл семинаров 2021 Центра Когнитивного Моделирования МФТИ.
Проводится еженедельно по четвергам в 17.00.

Программа семинаров: https://cogmodel.mipt.ru/seminars-autumn-2021
Семинар №9 от 18.11.2021.
Обзор работ по многоагентному обучению с подкреплением с конференций IJCAI и NeurIPS 2021 | Алексей Скрынник

Поговорим про работы по многоагентному обучению с подкреплением с ведущих конференций. На IJCAI работ по MARL было не очень много, но они достаточно практичные: применение MARL для торговли энергией и управления автобусами.

Конференция NeurIPS 2021 еще не началась, но список принятых статей уже известен, мы выберем и посмотрим интересные работы по MARL и подумаем над вопросами для их авторов.

Слайды: https://docs.google.com/presentation/d/1xMRnhkLu8TAscau0hQ3CYBcgdvjoxjKUNjUtAieXuvc/edit?usp=sharing

Магистратура и аспирантура по ИИ и робототехнике с повышенной стипендией: https://cogmodel.mipt.ru/applicants
Группа ВК: https://vk.com/cogmodel
Телеграм: https://t.me/cogmodel

Наши семинары открытые…

источник

18:33пожаловаться #10

2021 December 02

AY

Alexey Yurasov in RL reading group

JORLDY: OpenSource Reinforcement Learning Framework
https://www.reddit.com/r/reinforcementlearning/comments/qp9aj5/jorldy_opensource_reinforcement_learning_framework/?utm_medium=android_app&utm_source=share

JORLDY: OpenSource Reinforcement Learning Framework

Hello WoRLd! We are Reinforcement Learning (RL) engineers at KakaoEnterprise in South Korea! We published an opensource RL framework and named it...

источник

20:20пожаловаться #11

p

pa_antya in RL reading group

Кто-нибудь пробовал?
сравнивали с каталистом и/или RayRL?

источник

20:42пожаловаться #12

AY

Alexey Yurasov in RL reading group

Ещё нет

источник

20:57пожаловаться #13

ID

Ivan Drago in RL reading group

а смысл в нем какой? да вообще вцелом во всех этих фреймворках? кто-то запилил / переписал неск. алг-мов и добавил коннекторы к енвам, объединив все в одно репо, не понимаю...

источник

21:56пожаловаться #14

AY

Alexey Yurasov in RL reading group

Был опыт с handyrl. Но когда дело дошло до следующего соревнования, применить его не получилось😒

источник

22:19пожаловаться #15

2021 December 03

ID

Ivan Drago in RL reading group

Тогда брошу еще один, сегодня увидел у товарища в гитхбае:
https://github.com/thu-ml/tianshou

GitHub

GitHub - thu-ml/tianshou: An elegant PyTorch deep reinforcement learning library.

An elegant PyTorch deep reinforcement learning library. - GitHub - thu-ml/tianshou: An elegant PyTorch deep reinforcement learning library.

источник

20:31пожаловаться #16

AG

Alexander Grishin in RL reading group

Вижу, например, смысл в недавно увиденном, в котором каждый алгоритм реализован независимо/лаконично/аккуратно (во всяком случае преподносится так) в виде отдельном файлика. Так может быть проще модифицировать/использовать/разбираться.

источник

20:38пожаловаться #17

2021 December 06

SK

Sergey Kolesnikov in RL reading group

сап чат,
если кому интересен Offline RL evaluation,
check нашу с @vkurenkov идею [1]

кратко
искали способы ускорить evaluation для Prod.RL, посмотрели на NLP - Expected Validation Performance, вдохновились да и перенесли общую идею в Offline RL domain с бенчмарками и доработками (куда ж без танцев с бубном)

подробности
welcome на Offline Reinforcement Learning Workshop at NeurIPS [2] - будем там рассказывать, или просто пишите

PS. если кто подобным увлекаетесь - за cite будем благодарны, как сказали авторы "Should I Run Offline Reinforcement Learning or Behavioral Cloning?" [3]:
> "Thank you for pointing us to the interesting paper" - душевно.

PS2. всем NeuIPS.RL 🤖

1. paper: https://arxiv.org/abs/2110.04156
2. ORL workshop: https://offline-rl-neurips.github.io/2021/
3. another paper https://openreview.net/forum?id=AP1MKT37rJ

OpenReview

Should I Run Offline Reinforcement Learning or Behavioral Cloning?

Offline reinforcement learning (RL) algorithms can acquire effective policies by utilizing only previously collected experience, without any online interaction. While it is widely understood that...

источник

10:50пожаловаться #18

АК

Алексей Клоков... in RL reading group

🔥, спасибо

источник

10:51пожаловаться #19

AG

Alexander Grishin in RL reading group

звучит отлично!

источник

11:07пожаловаться #20