Ilya Kornakov
Ну у меня простые статистики, посчитанные на истории (в стиле средний просмотренный cpm пользователя, вероятность пользователя посмотреть рекламу в данное время суток, вероятность просмотреть рекламу на данной площадке, и т.д.), и CatBoost на 1к валидации для блендинга этих статистик
Добавление новых статистик уже никакого выигрыша не давало, так что интересно, что у 1ого места
Что не сработало (довольно удивительно) - фича "какой процент времени это объявление на данном пользователе задоминировано 3мя другими". Хотя может я просто набагал
Про "данное время суток" интересно. Там было достаточно много городов, чтобы они могли оказаться в разных часовых поясах
Можно было вычислить часовой пояс, сделав Фурье-анализ в сравнении обычным графиком (например) дневных нагрузок на веб-сервере. У меня это уперлось в то, что некоторые города имеют слишком мало просмотров их населением, и там вероятность ошибиться с часовым поясом была большой
В твоем решении как-то иначе определялся часовой пояс?