1. Фичи анонимные и даже толком не знаем, что именно предсказываем
2. Мл’ем предсказывать движение рынка - уже проходили несколько раз. От ту сигма. Не работает тут классический ml/dl. Тогда логреги — лучшее, что удавалось придумать
3. Приват будет скориться на реальных данных из будущего. А это биржа во времена ковида. Ещё «лучше».
4. Сигнала в данных нет. Я бил на трейн/тест по времени. Там аук на валидации 0.52 получается
5. Паблик кернелы - это совсем весело. Топ Кернел по скору - это кернел без валидации, с рок аук 0.56 на трейне. То есть человек валидируется по паблику. А паблик - это всего 15к строк. А трейн 1.9млн
А нет, тест вроде бы миллион строк составляет. test.csv — это, видимо, просто для отладки