Не дают. Поэтому там либо сразу на месяц предсказывать, либо обучаться на собственных предиктах. Я для отладки валидации не заморачивался и просто предсказывал на месяц вперёд. И вот локально такой подход и даёт 1.34 :/
Если б не люди с первого места, то можно было бы подумать, что все просто по паблику валидируются, но там на первом месте 4-ка из H2O. Как-то сомнительно, что они так глупо поступают.
Нет, там два лика. Он же MED_COLS считает в начале по всему трейну, а во вторых он лаговые фичи создаёт на уровне дней, а на тесте нам ведь истинные таргеты на уровне дней доступны не будут. На тесте лаговые фичи будут от прогнозов браться ведь
там уже у людей меньше единицы на "валидации") Но на паблике ж работает. А учитывая, что приват -- это вроде бы тоже только один месяц данных, то похоже, валидируйся-не валидируйся, а кому больше повезет в итоге
During the Training phase of the competition, this unseen test set is comprised of data for the month of May 2021 and the set of active players this year.