Size: a a a

ML Boot Camp Official

2020 March 09

ФД

Федор Добрянский in ML Boot Camp Official
Меня подвело, то что я:
1. Считал не часы а вьюрэйт на интервале часов по истории и по валсету
2. Делал отбор по юзерам с пересекающимися времянными интервалами
То есть я реально написал формулу аукциона, как он работает. Но приз-сюрприз интервалы тут вообще не влияли почему-то!!!!!
источник

ВК

Вячеслав Колосков in ML Boot Camp Official
а у меня зашел апсемплинг для валсета. 10 кратное увеличение валсета увеличивало скор на 10. хотя валидация переставала коррелировать с лидербордом :)
источник

Ivan Σ in ML Boot Camp Official
кто-нибудь пробовал делать предсказание для каждого пользователя и после считать долю?
источник

AT

Alexey Tikhonov in ML Boot Camp Official
Я
источник

AT

Alexey Tikhonov in ML Boot Camp Official
Вернее нет
источник

AT

Alexey Tikhonov in ML Boot Camp Official
Я считал просто в людях
источник

AT

Alexey Tikhonov in ML Boot Camp Official
Вернее в корнях людей
источник

М

Миша in ML Boot Camp Official
Ivan Σ
кто-нибудь пробовал делать предсказание для каждого пользователя и после считать долю?
Я пробовал
Хуже получалось
источник

М

Миша in ML Boot Camp Official
Слишком разреженные данные, видимо
источник

Ivan Σ in ML Boot Camp Official
ну просто логичнее кажется угадывать сколько раз каждый человек посмотрит…
Может кто интерпретировать это?
источник

Ivan Σ in ML Boot Camp Official
хмммммм
источник

AT

Alexey Tikhonov in ML Boot Camp Official
А так опасно, за единицу часто улетать будут, если только трансформировать потом ответ
источник

AT

Alexey Tikhonov in ML Boot Camp Official
Но фигня скорее всего будет
источник

AT

Alexey Tikhonov in ML Boot Camp Official
Там самое главное точность оценок где-то до 10%
источник

AT

Alexey Tikhonov in ML Boot Camp Official
А если все трансформировать, скорее всего там все разъедутся и будет больно
источник

AN

Anton Negreba in ML Boot Camp Official
Я пробовал по history по каждому пользователю делать оценку частоты посещений и через процесс Пуассона оценивать вероятность зайти хотя бы один/два/три раза. Для одного посещения работает лучше всего, потому что для двух-трёх не учитывалось то, что показы рекламы не чаще раза в 6 часов. Само по себе плохо работало, но как фича что-то добавило (на ~0.9 корреляция с at_least_one)
источник

JS

Jury Sergeev in ML Boot Camp Official
А по формуле 1 - (1 - pwin)^nviews можете пояснить? Вероятность охватить юзера выше, при большем кол-ве повторов показа, но доля тех кому показали хотя бы дважды - меньше, почему?
источник

A

Alex in ML Boot Camp Official
У меня обычный подсчет максимального количества посещений (без учета всего) уже коррелировал с at_least_one где-то на 0.8
источник

AP

Artem Popov in ML Boot Camp Official
zaur_zh
У меня примерно то, о чем тут почти все уже писали: полуаналитический подход, когда берутся юзеры и площадки из запроса, для них в часы из запроса находятся отношения цены из истории к цене запроса, далее эти числа тонко тюнятся (на это ушла громадная часть времени), суммируются и считаются фичи типа тех, что надо предсказать (доля тех, у кого суммы более 1, 2, 3 и тп). А дальше прикольно: это все кидается внезапно в SVR)) Так что получилось забавно, в первой тройке три разных инструмента.

Вопрос к автору задачи(@system29a). Какой результат у решения, которое в продакшене используется? Есть ощущение, что можно сильно лучше сделать
В проде сильно другая история, к сожалению. Очень много чего влияет на победу в аукционе, тут сильно упрощенный вариант. Цифр у меня нет. В проде нет ML — используется эвристика, основанная на логнормальном распределении вероятности победить исходя из ставки.
источник

JS

Jury Sergeev in ML Boot Camp Official
Artem Popov
В проде сильно другая история, к сожалению. Очень много чего влияет на победу в аукционе, тут сильно упрощенный вариант. Цифр у меня нет. В проде нет ML — используется эвристика, основанная на логнормальном распределении вероятности победить исходя из ставки.
Вот очень интересно, как это делается, из видео понятны направления, но до конца этот способ довести не успел
источник