Size: a a a

ML Boot Camp Official

2020 March 09

JS

Jury Sergeev in ML Boot Camp Official
кто нибудь про формулу расскажите, а??? удалось у кого методу реализовать что в видосах рассказывалось?
источник

AT

Alexey Tikhonov in ML Boot Camp Official
Относительный отрыв у них
источник

P

Polosataya in ML Boot Camp Official
Я так в Питер хочу поехать...
источник

P

Polosataya in ML Boot Camp Official
Иван Брагин
У меня все решения примерно тот же скор дали
Ты будешь узнавать, оплатят ли поездку орги?
источник

EG

Elena German in ML Boot Camp Official
И я хочу, но не поеду
источник

P

Polosataya in ML Boot Camp Official
А у меня денег нет ...
источник

ИБ

Иван Брагин in ML Boot Camp Official
https://github.com/BraginIvan/vkcup2019
Закинул файлик stage2
источник

М

Миша in ML Boot Camp Official
Спасибо 🙏
источник

AP

Artem Popov in ML Boot Camp Official
Настоящий бейзлайн по задачке выбивал порядка 29. Классно, что много кто порвал его, было очень интересно смотреть за прогрессом по скорам :)
Если у кого то есть вопросы по задачке — спрашивайте :)
источник

ИБ

Иван Брагин in ML Boot Camp Official
Там может не очень понятно, это рабочий код, а не присесанный
источник

JS

Jury Sergeev in ML Boot Camp Official
Artem Popov
Настоящий бейзлайн по задачке выбивал порядка 29. Классно, что много кто порвал его, было очень интересно смотреть за прогрессом по скорам :)
Если у кого то есть вопросы по задачке — спрашивайте :)
что в validate_tsv?? что означает каждая строчка? это аукцион? предварительный расчет доли показов в зависимости от?
источник

ИБ

Иван Брагин in ML Boot Camp Official
Идея в чем
Есть список users и publishers
И в history есть эти пользователи и площадки. Давайте по каждому пользователю определим сколько он раз смотрел рекламу на площадке x
источник

IK

Ilya Kornakov in ML Boot Camp Official
Alexey Tikhonov
Мне очень интересен топ 5
Ну у меня простые статистики, посчитанные на истории (в стиле средний просмотренный cpm пользователя, вероятность пользователя посмотреть рекламу в данное время суток, вероятность просмотреть рекламу на данной площадке, и т.д.), и CatBoost на 1к валидации для блендинга этих статистик
Добавление новых статистик уже никакого выигрыша не давало, так что интересно, что у 1ого места
Что не сработало (довольно удивительно) - фича "какой процент времени это объявление на данном пользователе задоминировано 3мя другими". Хотя может я просто набагал
источник

ИБ

Иван Брагин in ML Boot Camp Official
Далее по строке validate делаем пермутацию пользователя и публикации и складываем по каждому
источник

AT

Alexey Tikhonov in ML Boot Camp Official
Ilya Kornakov
Ну у меня простые статистики, посчитанные на истории (в стиле средний просмотренный cpm пользователя, вероятность пользователя посмотреть рекламу в данное время суток, вероятность просмотреть рекламу на данной площадке, и т.д.), и CatBoost на 1к валидации для блендинга этих статистик
Добавление новых статистик уже никакого выигрыша не давало, так что интересно, что у 1ого места
Что не сработало (довольно удивительно) - фича "какой процент времени это объявление на данном пользователе задоминировано 3мя другими". Хотя может я просто набагал
Ого, удивительно что буст все же
источник

ИБ

Иван Брагин in ML Boot Camp Official
Получается такое вот activity
источник

ИБ

Иван Брагин in ML Boot Camp Official
Потом тоже самое но только по рекламам которые дешевле X
источник

PA

Pavel Alekseev in ML Boot Camp Official
Иван Брагин
Идея в чем
Есть список users и publishers
И в history есть эти пользователи и площадки. Давайте по каждому пользователю определим сколько он раз смотрел рекламу на площадке x
а как вы хранили эти данные? я напарсил по часам массивы, получились файлы по 50-200Мб
источник

ИБ

Иван Брагин in ML Boot Camp Official
Ну и учил я сразу на конечную метрику, хотя bce тут и так норм заходит
источник

ИБ

Иван Брагин in ML Boot Camp Official
Там очень мало получается
источник