Size: a a a

RL reading group

2021 October 27

АН

Александр Никулин... in RL reading group
https://stackoverflow.com/questions/56964657/cartpole-v0-loss-increasing-using-dqn
вот тут простое, если причина в этом, то поможет, если нет то нет :/
источник

MM

Michael Melnik in RL reading group
можно последить за поведением получаемых value, advantage значений
источник
2021 October 30

EZ

Evgenii Zheltonozhsk... in RL reading group
@cydoroga чел добавляет всех в левый чат
источник

SK

Sergey Kolesnikov in RL reading group
удалил 😉
источник
2021 October 31

c

cydoroga in RL reading group
Bonjour
источник
2021 November 01

SK

Sergey Kolesnikov in RL reading group
сап чат,
вместе с @vkurenkov ищем ресечеров и студентов на темы связанные с Offline RL, RecSys.RL, RecSys
цель - публикации
подробности - лучше в личке, это ж не _jobs
:thanks:
источник
2021 November 18

it

igor tokarev in RL reading group
⚡ — Начинаем семинар, присоединяйтесь! https://youtu.be/aD5aONXrYzA
YouTube
Семинар 9. Обзор работ по многоагентному обучению с подкреплением с конференций IJCAI и NeurIPS 2021
Осенницй цикл семинаров 2021 Центра Когнитивного Моделирования МФТИ.
Проводится еженедельно по четвергам в 17.00.

Программа семинаров: https://cogmodel.mipt.ru/seminars-autumn-2021
Семинар №9 от 18.11.2021.
Обзор работ по многоагентному обучению с подкреплением с конференций IJCAI и NeurIPS 2021 |  Алексей Скрынник

Поговорим про работы по многоагентному обучению с подкреплением с ведущих конференций. На IJCAI работ по MARL было не очень много, но они достаточно практичные: применение MARL для торговли энергией и управления автобусами.

Конференция NeurIPS 2021 еще не началась, но список принятых статей уже известен, мы выберем и посмотрим интересные работы по MARL и подумаем над вопросами для их авторов.

Слайды: tba

Магистратура и аспирантура по ИИ и робототехнике с повышенной стипендией: https://cogmodel.mipt.ru/applicants
Группа ВК: https://vk.com/cogmodel
Телеграм: https://t.me/cogmodel


Наши семинары открытые - приглашаем принять участие всех желающих. Если у вас есть тема, котоая укладывается в наши…
источник

it

igor tokarev in RL reading group
Сейчас идёт
источник
2021 November 28

АС

Агент Сейлз... in RL reading group
видео  недоступно
источник

AK

Arseny Kuznetsov in RL reading group
YouTube
Семинар 9. Обзор работ по многоагентному обучению с подкреплением с конференций IJCAI и NeurIPS 2021
Осенницй цикл семинаров 2021 Центра Когнитивного Моделирования МФТИ.
Проводится еженедельно по четвергам в 17.00.

Программа семинаров: https://cogmodel.mipt.ru/seminars-autumn-2021
Семинар №9 от 18.11.2021.
Обзор работ по многоагентному обучению с подкреплением с конференций IJCAI и NeurIPS 2021 |  Алексей Скрынник

Поговорим про работы по многоагентному обучению с подкреплением с ведущих конференций. На IJCAI работ по MARL было не очень много, но они достаточно практичные: применение MARL для торговли энергией и управления автобусами.

Конференция NeurIPS 2021 еще не началась, но список принятых статей уже известен, мы выберем и посмотрим интересные работы по MARL и подумаем над вопросами для их авторов.

Слайды: https://docs.google.com/presentation/d/1xMRnhkLu8TAscau0hQ3CYBcgdvjoxjKUNjUtAieXuvc/edit?usp=sharing

Магистратура и аспирантура по ИИ и робототехнике с повышенной стипендией: https://cogmodel.mipt.ru/applicants
Группа ВК: https://vk.com/cogmodel
Телеграм: https://t.me/cogmodel


Наши семинары открытые…
источник
2021 December 02

AY

Alexey Yurasov in RL reading group
источник

p

pa_antya in RL reading group
Кто-нибудь пробовал?
сравнивали с каталистом и/или RayRL?
источник

AY

Alexey Yurasov in RL reading group
Ещё нет
источник

ID

Ivan Drago in RL reading group
а смысл в нем какой? да вообще вцелом во всех этих фреймворках? кто-то запилил / переписал неск. алг-мов и добавил коннекторы к енвам, объединив все в одно репо, не понимаю...
источник

AY

Alexey Yurasov in RL reading group
Был опыт с handyrl. Но когда дело дошло до следующего соревнования, применить его не получилось😒
источник
2021 December 03

ID

Ivan Drago in RL reading group
Тогда брошу еще один, сегодня увидел у товарища в гитхбае:
https://github.com/thu-ml/tianshou
источник

AG

Alexander Grishin in RL reading group
Вижу, например, смысл в недавно увиденном, в котором каждый алгоритм реализован независимо/лаконично/аккуратно (во всяком случае преподносится так) в виде отдельном файлика. Так может быть проще модифицировать/использовать/разбираться.
источник
2021 December 06

SK

Sergey Kolesnikov in RL reading group
сап чат,
если кому интересен Offline RL evaluation,
check нашу с @vkurenkov идею [1]

кратко
искали способы ускорить evaluation для Prod.RL, посмотрели на NLP - Expected Validation Performance, вдохновились да и перенесли общую идею в Offline RL domain с бенчмарками и доработками (куда ж без танцев с бубном)

подробности
welcome на Offline Reinforcement Learning Workshop at NeurIPS [2] - будем там рассказывать, или просто пишите

PS. если кто подобным увлекаетесь - за cite будем благодарны, как сказали авторы "Should I Run Offline Reinforcement Learning or Behavioral Cloning?" [3]:
> "Thank you for pointing us to the interesting paper" - душевно.

PS2. всем NeuIPS.RL 🤖

1. paper: https://arxiv.org/abs/2110.04156
2. ORL workshop: https://offline-rl-neurips.github.io/2021/
3. another paper  https://openreview.net/forum?id=AP1MKT37rJ
источник

АК

Алексей Клоков... in RL reading group
🔥, спасибо
источник

AG

Alexander Grishin in RL reading group
звучит отлично!
источник