Телеграмм чат группы mlbootcamp страница 13587

2020 February 24

P

мне надо просто по списку подставить значения... я могу это криво сделать.. но в докере такого не повторить для новых данных

источник

13:05пожаловаться #1

AP

Artem Prokhorov in ML Boot Camp Official

Alexey Tikhonov

Как может быть дробное число фильмов? И так мало утонувших в бассейнах ?

Порядка 100 человек вроде не так мало

источник

13:13пожаловаться #2

AN

Anton Negreba in ML Boot Camp Official

Polosataya

мне надо просто по списку подставить значения... я могу это криво сделать.. но в докере такого не повторить для новых данных

А нужно какие-то агрегаты по паблишерам по истории посчитать? Для количества людей можно сделать как-то так

history[history.publisher.isin([7,17])].shape[0]

Для других статистик просто не shape, а что тебе нужно

источник

13:13пожаловаться #3

AT

Alexey Tikhonov in ML Boot Camp Official

Polosataya

Не могу сообразить, как считать, если publishers больше одного. Если бы в первой строке validate был только 7ой паблишер, то в аудиторию бы просто подставила 66134 из группировки по history. Но там 7 и 17, как сделать, чтобы в аудитории было 66134 + 196? Может кто подскажет?

Откуда 196?

источник

13:13пожаловаться #4

P

Polosataya in ML Boot Camp Official

у меня хистори уже сгруппирована в датафрейм.. одна колонка паблишер, вторая количество человек

источник

13:14пожаловаться #5

P

Polosataya in ML Boot Camp Official

я хочу в итоговый датафрейм суммировать человеков для всех паблишеров

источник

13:14пожаловаться #6

P

Polosataya in ML Boot Camp Official

Anton Negreba

А нужно какие-то агрегаты по паблишерам по истории посчитать? Для количества людей можно сделать как-то так

history[history.publisher.isin([7,17])].shape[0]

Для других статистик просто не shape, а что тебе нужно

каждый раз по хистори считать долго.. у меня уже маленькая табличка с 21 строкой

источник

13:15пожаловаться #7

AN

Anton Negreba in ML Boot Camp Official

А, ну вместо history просто используй твою табличку с sum() по нужному столбцу

Типа custom_df[custom_df.publisher.isin([7,17])].publisher_count.sum()

источник

13:19пожаловаться #8

P

Polosataya in ML Boot Camp Official

но 7,17 это только в первой строке.. во второй 3,18..

источник

13:20пожаловаться #9

P

Polosataya in ML Boot Camp Official

мне надо колонку по всем строкам заполнить

источник

13:20пожаловаться #10

AN

Anton Negreba in ML Boot Camp Official

Строку из паблишеров можно перевести в список через list(map(int, publishers.split(',')))

Это представляешь вместо [7,17] и через apply применяешь как lambda функцию (например)

Получится типа

validate.publishers.apply(lambda x: custom_df[custom_df.publisher.isin(list(map(int, x.split(','))))].publisher_count.sum())

источник

13:29пожаловаться #11

P

Polosataya in ML Boot Camp Official

Anton Negreba

Строку из паблишеров можно перевести в список через list(map(int, publishers.split(',')))

Это представляешь вместо [7,17] и через apply применяешь как lambda функцию (например)

Получится типа

validate.publishers.apply(lambda x: custom_df[custom_df.publisher.isin(list(map(int, x.split(','))))].publisher_count.sum())

да..это оно.. спасибо

источник

13:34пожаловаться #12

МР

Марк Рофин in ML Boot Camp Official

Друзья, можете, пожалуйста, ответить: я чего-то не понимаю, или history.tsv неполное и там очень сильно недостает столбца с id публикации? Это ведь могло бы крайне сильно помочь

источник

13:35пожаловаться #13

IΣ

Ivan Σ in ML Boot Camp Official

Зумеры на р не пишут

источник

13:47пожаловаться #14

NB

Nikolai Bragin in ML Boot Camp Official

Учи молодежный сленг, бумер!

источник

14:27пожаловаться #15