сап чат,
если кому интересен Offline RL evaluation,
check нашу с
@vkurenkov идею [1]
краткоискали способы ускорить evaluation для Prod.RL, посмотрели на NLP - Expected Validation Performance, вдохновились да и перенесли общую идею в Offline RL domain с бенчмарками и доработками (куда ж без танцев с бубном)
подробностиwelcome на Offline Reinforcement Learning Workshop at NeurIPS [2] - будем там рассказывать, или просто пишите
PS. если кто подобным увлекаетесь - за cite будем благодарны, как сказали авторы "Should I Run Offline Reinforcement Learning or Behavioral Cloning?" [3]:
> "Thank you for pointing us to the interesting paper" - душевно.
PS2. всем NeuIPS.RL 🤖
1. paper:
https://arxiv.org/abs/2110.041562. ORL workshop:
https://offline-rl-neurips.github.io/2021/3. another paper
https://openreview.net/forum?id=AP1MKT37rJ