Size: a a a

Python для анализа данных

2019 August 27

DR

Dmitry Rodin in Python для анализа данных
и нет смысла делить даже
источник

DR

Dmitry Rodin in Python для анализа данных
dgj dfsh
эта задача уже решена в pandas
поздравляю!
источник

DR

Dmitry Rodin in Python для анализа данных
и в постгресе есть массивы и в кликхаусе
источник

dd

dgj dfsh in Python для анализа данных
т.е. в постргес и КХ можно их стандартными средствами развернуть значения колонки в колонки?
источник

DR

Dmitry Rodin in Python для анализа данных
правда, нет времени на болтовню. будет конкретная задача, вэлкам
источник

DR

Dmitry Rodin in Python для анализа данных
dgj dfsh
т.е. в постргес и КХ можно их стандартными средствами развернуть значения колонки в колонки?
хоть на марсе )
источник

dd

dgj dfsh in Python для анализа данных
ну понятно с вами
источник

DR

Dmitry Rodin in Python для анализа данных
ага) взаимно)
источник

A

Ashron in Python для анализа данных
dgj dfsh
как в БД развернуть значения в какой-то колонке, чтобы они стали колонками, типа как в pandas можно сделать с pivot_table?
Если действительно надо то, для примера : https://docs.microsoft.com/ru-RU/sql/t-sql/queries/from-using-pivot-and-unpivot?view=aps-pdw-2016
источник

ВЛ

Владислав Литвинюк... in Python для анализа данных
Привет, а можно преобразовать с даты в неделю, но в формате даты в pd.Series
Пример:
date
2019 - 01 - 01
2019 - 01 - 02
2019 - 01 - 03
2019 - 01 - 04
2019 - 01 - 05
2019 - 01 - 06
2019 - 01 - 07
2019 - 01 - 08
В:
2019 - 01 - 01
2019 - 01 - 01
2019 - 01 - 01
2019 - 01 - 01
2019 - 01 - 01
2019 - 01 - 01
2019 - 01 - 01
2019 - 01 - 08
Сделал так:

df_kag['date'].apply(lambda x: x.strftime('%Y-%m-w%V')) 

но из-за месяцов строчки дублируються
источник

АМ

Алексей Макаров... in Python для анализа данных
df['week'] = df['day'] - pd.to_timedelta(df['day'].dt.dayofweek, unit='d')
источник

АМ

Алексей Макаров... in Python для анализа данных
Ну и если в df['day'] стоит не date, а datetime, то нужно сначала преобразовать к date. df['week'] = pd.to_datetime(df['day']).dt.date - pd.to_timedelta(df['day'].dt.dayofweek, unit='d')
источник

ВЛ

Владислав Литвинюк... in Python для анализа данных
Алексей Макаров
Ну и если в df['day'] стоит не date, а datetime, то нужно сначала преобразовать к date. df['week'] = pd.to_datetime(df['day']).dt.date - pd.to_timedelta(df['day'].dt.dayofweek, unit='d')
спасибо!
источник
2019 August 28

dd

dgj dfsh in Python для анализа данных
О, спасибо! Я правильно понял, что там можно только одну агрегирующую ф-ию использовать для разворачиваемого столбца?
источник

A

Ashron in Python для анализа данных
dgj dfsh
О, спасибо! Я правильно понял, что там можно только одну агрегирующую ф-ию использовать для разворачиваемого столбца?
Да, один специальный оператор - pivot (unpivot - в обратную сторону - столбцы в строки)
источник

dd

dgj dfsh in Python для анализа данных
Ashron
Да, один специальный оператор - pivot (unpivot - в обратную сторону - столбцы в строки)
Не, внутри pivot, типа pivot (count(...), sum(...) for ...) Так можно?
источник

NS

Nikita Shein in Python для анализа данных
dgj dfsh
О, спасибо! Я правильно понял, что там можно только одну агрегирующую ф-ию использовать для разворачиваемого столбца?
ну правда, опишите задачу, которую вы собираетесь решать.

пивот лучше делать на максимально последнем шаге
ну т.е. прям в момент итогового вывода
источник

A

Ashron in Python для анализа данных
Nikita Shein
ну правда, опишите задачу, которую вы собираетесь решать.

пивот лучше делать на максимально последнем шаге
ну т.е. прям в момент итогового вывода
👍
источник

dd

dgj dfsh in Python для анализа данных
Nikita Shein
ну правда, опишите задачу, которую вы собираетесь решать.

пивот лучше делать на максимально последнем шаге
ну т.е. прям в момент итогового вывода
В данном контексте хочу просто понять применимость этого механизма в мс скл.
источник

dd

dgj dfsh in Python для анализа данных
В оракл например можно объявлять множество агрегирующих ф-ий для столбца, но механизм вывода там не такой удобный как в мс скл
источник