Size: a a a

ML Boot Camp Official

2020 March 09

ИБ

Иван Брагин in ML Boot Camp Official
Users_pub_activities  можно посмотреть как создаются
источник

М

Миша in ML Boot Camp Official
Кстати, вы заметили что метрика ассиметричная? Никто не пытался это как-то использовать?
источник

AT

Alexey Tikhonov in ML Boot Camp Official
Она очень бОльная
источник

AT

Alexey Tikhonov in ML Boot Camp Official
Метрика
источник

P

Polosataya in ML Boot Camp Official
А я таргет умножала на 1000 и логарифмировала
источник

AT

Alexey Tikhonov in ML Boot Camp Official
Зачем умножать ?
источник

ИБ

Иван Брагин in ML Boot Camp Official
Да ладно, bce можно было брать просто
источник

ИБ

Иван Брагин in ML Boot Camp Official
Но лучше сразу конечную учить
источник

AT

Alexey Tikhonov in ML Boot Camp Official
Что такое bce?
источник

ИБ

Иван Брагин in ML Boot Camp Official
Она же диффиринцируема
источник

ИБ

Иван Брагин in ML Boot Camp Official
Binary crossentropy
источник

ИБ

Иван Брагин in ML Boot Camp Official
Только с нецелыми таргетами
источник

М

Миша in ML Boot Camp Official
источник

IS

Ilya Shamov in ML Boot Camp Official
Ilya Kornakov
Ну у меня простые статистики, посчитанные на истории (в стиле средний просмотренный cpm пользователя, вероятность пользователя посмотреть рекламу в данное время суток, вероятность просмотреть рекламу на данной площадке, и т.д.), и CatBoost на 1к валидации для блендинга этих статистик
Добавление новых статистик уже никакого выигрыша не давало, так что интересно, что у 1ого места
Что не сработало (довольно удивительно) - фича "какой процент времени это объявление на данном пользователе задоминировано 3мя другими". Хотя может я просто набагал
Про "данное время суток" интересно. Там было достаточно много городов, чтобы они могли оказаться в разных часовых поясах
Можно было вычислить часовой пояс, сделав Фурье-анализ в сравнении обычным графиком (например) дневных нагрузок на веб-сервере. У меня это уперлось в то, что некоторые города имеют слишком мало просмотров их населением, и там вероятность ошибиться с часовым поясом была большой
В твоем решении как-то иначе определялся часовой пояс?
источник

JS

Jury Sergeev in ML Boot Camp Official
Ilya Shamov
Про "данное время суток" интересно. Там было достаточно много городов, чтобы они могли оказаться в разных часовых поясах
Можно было вычислить часовой пояс, сделав Фурье-анализ в сравнении обычным графиком (например) дневных нагрузок на веб-сервере. У меня это уперлось в то, что некоторые города имеют слишком мало просмотров их населением, и там вероятность ошибиться с часовым поясом была большой
В твоем решении как-то иначе определялся часовой пояс?
один и тот же пояс, это видно по history
источник

IS

Ilya Shamov in ML Boot Camp Official
Мне показались разными 🤷‍♂
источник

ИБ

Иван Брагин in ML Boot Camp Official
Ilya Shamov
Про "данное время суток" интересно. Там было достаточно много городов, чтобы они могли оказаться в разных часовых поясах
Можно было вычислить часовой пояс, сделав Фурье-анализ в сравнении обычным графиком (например) дневных нагрузок на веб-сервере. У меня это уперлось в то, что некоторые города имеют слишком мало просмотров их населением, и там вероятность ошибиться с часовым поясом была большой
В твоем решении как-то иначе определялся часовой пояс?
А в vk api нельзя спарсить идентификаторы
источник

ИБ

Иван Брагин in ML Boot Camp Official
По-моему они оттуда
источник

ИБ

Иван Брагин in ML Boot Camp Official
Хотя там вроде Питер номер 1 стоит
источник

DN

Dmitrii Nikitko in ML Boot Camp Official
@bragin_ivan
а не пробовал градиентный бустинг на тех же фичах ?
источник