Size: a a a

Python для анализа данных

2019 May 21

YP

Yuriy Prudnikov in Python для анализа данных
Всем привет. Как мне посмотреть все столбцы одной строки разом? df.iloc[1] возвращает то, что я хочу, но в силу того, что столбцов сильно много, в середину он вставляет точки
источник

YP

Yuriy Prudnikov in Python для анализа данных
источник

YP

Yuriy Prudnikov in Python для анализа данных
Задал pd.set_option('display.max_columns', -1), но он работает только при отображении нескольких строк
источник

YP

Yuriy Prudnikov in Python для анализа данных
Есть ли такое же свойство, но для отображения одной строки в столбик, как на скрине?
источник

P

Peter in Python для анализа данных
можно сохранить их в список с помощью df.iloc[1].tolist()
источник

YP

Yuriy Prudnikov in Python для анализа данных
Все оказалось куда банальнее.
Вместо pd.set_option('display.max_columns', -1)
Надо добавить pd.set_option('display.max_rows', <Необходимое число строк>)
источник

O

Oleh in Python для анализа данных
источник

O

Oleh in Python для анализа данных
Подскажите плз самый оптимальный способ посчитать следующее: по каждому ID, взять TimeBetween, кот. соответствует максимальной Date и поделить на среднее по всем TimeBetween исключая последний по Date
источник
2019 May 22

AT

Arnaud Trousset in Python для анализа данных
В поиске специалиста Python + PostGreSQL + PostGIS для проекта (1 месяц) автоматический сбор данных и автоматизация процессов.      Офис, Москва, Чистые Пруды.
Резюме и ожидание по зп послать по адресу: a.trousset@rilos.ru
Спасибо!
источник

АМ

Алексей Макаров... in Python для анализа данных
Oleh
Подскажите плз самый оптимальный способ посчитать следующее: по каждому ID, взять TimeBetween, кот. соответствует максимальной Date и поделить на среднее по всем TimeBetween исключая последний по Date
index_of_max_date = temp.groupby('ID', sort=False)['Date'].transform(max) == temp['Date'] # Создаем маску, где True будет соответствовать строкам с максимальным Date
max_date_rows = temp[index_of_max_date][['ID','TimeBetween']].rename(columns={'TimeBetween':'MaxDateTimeBetween'}) # Фильтруем фрейм по маске: оставляем только строки с максимальным Date
exclude_max_date_rows = temp[~index_of_max_values] # Фильтруем фрейм по маске: оставляем все строки, КРОМЕ строки с максимальным Date
mean_df = exclude_max_date_rows.groupby('ID',as_index=False)['TimeBetween'].mean().rename(columns={'TimeBetween':'MeanTimeBetween'}) # Считаем среднее по TimeBetween в exclude_max_date_rows
merged_df = mean_df.merge(max_date_rows,on='ID',how='left') # Объединяем mean_df с max_date_rows по ID
merged_df['Ratio'] = merged_df['MaxDateTimeBetween']/merged_df['MeanTimeBetween'] # Считаем отношение
источник

АМ

Алексей Макаров... in Python для анализа данных
Если ещё актуально
источник

O

Oleh in Python для анализа данных
Алексей Макаров
index_of_max_date = temp.groupby('ID', sort=False)['Date'].transform(max) == temp['Date'] # Создаем маску, где True будет соответствовать строкам с максимальным Date
max_date_rows = temp[index_of_max_date][['ID','TimeBetween']].rename(columns={'TimeBetween':'MaxDateTimeBetween'}) # Фильтруем фрейм по маске: оставляем только строки с максимальным Date
exclude_max_date_rows = temp[~index_of_max_values] # Фильтруем фрейм по маске: оставляем все строки, КРОМЕ строки с максимальным Date
mean_df = exclude_max_date_rows.groupby('ID',as_index=False)['TimeBetween'].mean().rename(columns={'TimeBetween':'MeanTimeBetween'}) # Считаем среднее по TimeBetween в exclude_max_date_rows
merged_df = mean_df.merge(max_date_rows,on='ID',how='left') # Объединяем mean_df с max_date_rows по ID
merged_df['Ratio'] = merged_df['MaxDateTimeBetween']/merged_df['MeanTimeBetween'] # Считаем отношение
Круто, спасибо! Буду проверять
источник

VN

Vlad Nykytenko in Python для анализа данных
не по теме немного, извините.
ребят, а кто-нибудь использовал measurement protocol? можете пожалуйста рассказать почему стали его использовать, и какой профит от этого получили?

насколько я понимаю, с помощью него можно напрямую пушить ивенты в га
источник

OB

Oleg Basmanov in Python для анализа данных
Vlad Nykytenko
не по теме немного, извините.
ребят, а кто-нибудь использовал measurement protocol? можете пожалуйста рассказать почему стали его использовать, и какой профит от этого получили?

насколько я понимаю, с помощью него можно напрямую пушить ивенты в га
пуш транзакций перенсли на него. потери транзакций с 20% почти до ноля сократились
источник

VN

Vlad Nykytenko in Python для анализа данных
а как это у вас реализовано?  если не секрет, не могли бы рассказать?
источник

OB

Oleg Basmanov in Python для анализа данных
программисту тз поставил, он сделал. т.е когда юзер подтверждает транзакцию, она уходит не с фронта а с бека
источник

VN

Vlad Nykytenko in Python для анализа данных
о, это то что нужно похоже, спасибо.
источник

AR

Artem Razgonov in Python для анализа данных
Vlad Nykytenko
о, это то что нужно похоже, спасибо.
Но с ивентами, которые сервер не пишет к себе изначально, может быть проблема. Т.е. чтобы запушить клик на кнопку (которая не вызывает создания транзакции или иной сущности, которая кладётся сервером в БД) через measurement protocol в GA, все равно придётся реализовывать логику на фронте - и уже с ней могут быть проблемы, имейте в виду.
источник

VN

Vlad Nykytenko in Python для анализа данных
мне как раз нужны ивенты, которые происходят без взаимодействия с фронтом
источник

AR

Artem Razgonov in Python для анализа данных
Vlad Nykytenko
мне как раз нужны ивенты, которые происходят без взаимодействия с фронтом
тогда успехов с внедрением)
источник