Size: a a a

ML Boot Camp Official

2020 February 24

P

Polosataya in ML Boot Camp Official
мне надо просто по списку подставить значения... я могу это криво сделать.. но в докере такого не повторить для новых данных
источник

AP

Artem Prokhorov in ML Boot Camp Official
Alexey Tikhonov
Как может быть дробное число фильмов? И так мало утонувших в бассейнах ?
Порядка 100 человек вроде не так мало
источник

AN

Anton Negreba in ML Boot Camp Official
Polosataya
мне надо просто по списку подставить значения... я могу это криво сделать.. но в докере такого не повторить для новых данных
А нужно какие-то агрегаты по паблишерам по истории посчитать? Для количества людей можно сделать как-то так

history[history.publisher.isin([7,17])].shape[0]

Для других статистик просто не shape, а что тебе нужно
источник

AT

Alexey Tikhonov in ML Boot Camp Official
Polosataya
Не могу сообразить, как считать, если publishers больше одного. Если бы в первой строке validate был только 7ой паблишер, то в аудиторию бы просто подставила 66134 из группировки по history. Но там 7 и 17, как сделать, чтобы в аудитории было 66134 + 196? Может кто подскажет?
Откуда 196?
источник

P

Polosataya in ML Boot Camp Official
у меня хистори уже сгруппирована в датафрейм.. одна колонка паблишер, вторая количество человек
источник

P

Polosataya in ML Boot Camp Official
я хочу в итоговый датафрейм суммировать человеков для всех паблишеров
источник

P

Polosataya in ML Boot Camp Official
Anton Negreba
А нужно какие-то агрегаты по паблишерам по истории посчитать? Для количества людей можно сделать как-то так

history[history.publisher.isin([7,17])].shape[0]

Для других статистик просто не shape, а что тебе нужно
каждый раз по хистори считать долго.. у меня уже маленькая табличка с 21 строкой
источник

AN

Anton Negreba in ML Boot Camp Official
А, ну вместо history просто используй твою табличку с sum() по нужному столбцу

Типа custom_df[custom_df.publisher.isin([7,17])].publisher_count.sum()
источник

P

Polosataya in ML Boot Camp Official
но 7,17 это только в первой строке.. во второй 3,18..
источник

P

Polosataya in ML Boot Camp Official
мне надо колонку по всем строкам заполнить
источник

AN

Anton Negreba in ML Boot Camp Official
Строку из паблишеров можно перевести в список через list(map(int, publishers.split(',')))

Это представляешь вместо [7,17] и через apply применяешь как lambda функцию (например)

Получится типа

validate.publishers.apply(lambda x: custom_df[custom_df.publisher.isin(list(map(int, x.split(','))))].publisher_count.sum())
источник

P

Polosataya in ML Boot Camp Official
Anton Negreba
Строку из паблишеров можно перевести в список через list(map(int, publishers.split(',')))

Это представляешь вместо [7,17] и через apply применяешь как lambda функцию (например)

Получится типа

validate.publishers.apply(lambda x: custom_df[custom_df.publisher.isin(list(map(int, x.split(','))))].publisher_count.sum())
да..это оно.. спасибо
источник

МР

Марк Рофин in ML Boot Camp Official
Друзья, можете, пожалуйста, ответить: я чего-то не понимаю, или history.tsv неполное и там очень сильно недостает столбца с id публикации? Это ведь могло бы крайне сильно помочь
источник

Ivan Σ in ML Boot Camp Official
Зумеры на р не пишут
источник

NB

Nikolai Bragin in ML Boot Camp Official
Учи молодежный сленг, бумер!
источник

AP

Artem Prokhorov in ML Boot Camp Official
источник

IT

Ivan Ti in ML Boot Camp Official
😏
источник

IT

Ivan Ti in ML Boot Camp Official
Прикольно,мои дети уже пост-зумеры. Интересно, что это будет.
источник

AP

Artem Prokhorov in ML Boot Camp Official
Правда не понятно какие смартфоны в 97
источник

RP

Roman Potemin in ML Boot Camp Official
Добрый день, с чем это может быть связано?
источник