Size: a a a

Python для анализа данных

2019 August 07

АМ

Алексей Макаров... in Python для анализа данных
Константин
пробовал пойти по пути

#cсоздаю df по длинне когорт
>>> df = pd.DataFrame(columns=['lib', 'cogort1', ''cogort2'])

#обхожу все строки
>>> for i in range(5):

#формирую строку с длинной рвыной количеству столбцов, но надо контролировать пустые строчки в месяцах, что нет
>>>     df.loc[i] = ['name' + str(i)] + list(randint(10, size=2))

но что, то тоже запутался)
Смотрите, когорты формируют по месяцу регистрации. То есть у вас немного напутано с именами колонок. registration - это в вашем случае когорта (и именно этот параметр правильнее называть cohort). А то, что вы называете cogort_month - это уже месяц наблюдений, то есть просто month или charge_month (то есть месяц, когда были осуществлены списания денег с пользователей). Но это вопрос терминологии.

Чтобы построить нужную таблицу вы можете использовать pivot_table(). Вот пример: df.pivot_table(index='registration', columns = 'cogort_month', values='money', aggfunc = 'sum')

Вышеприведенная функция построит сводную таблицу, где в колонках будут месяца наблюдений, но они будут абсолютные. Если вам нужно подсчитать относительный месяц, то вы можете сделать вот так df['nb_months'] = (df.cogort_month - df.registration)/ np.timedelta64(1, 'M'). Тогда в колонке nb_months будет порядковый месяц относительно месяца регистрации. И уже потом эту колонку используйте в параметре columns при построении сводной.
источник

К

Константин in Python для анализа данных
Алексей Макаров
Смотрите, когорты формируют по месяцу регистрации. То есть у вас немного напутано с именами колонок. registration - это в вашем случае когорта (и именно этот параметр правильнее называть cohort). А то, что вы называете cogort_month - это уже месяц наблюдений, то есть просто month или charge_month (то есть месяц, когда были осуществлены списания денег с пользователей). Но это вопрос терминологии.

Чтобы построить нужную таблицу вы можете использовать pivot_table(). Вот пример: df.pivot_table(index='registration', columns = 'cogort_month', values='money', aggfunc = 'sum')

Вышеприведенная функция построит сводную таблицу, где в колонках будут месяца наблюдений, но они будут абсолютные. Если вам нужно подсчитать относительный месяц, то вы можете сделать вот так df['nb_months'] = (df.cogort_month - df.registration)/ np.timedelta64(1, 'M'). Тогда в колонке nb_months будет порядковый месяц относительно месяца регистрации. И уже потом эту колонку используйте в параметре columns при построении сводной.
👍
источник

Т

Татьяна in Python для анализа данных
​​Подборка полезных сниппетов кода для Pandas:

https://vishalmnemonic.github.io/DC9/

via @ProductAnalytics
источник

АМ

Алексей Макаров... in Python для анализа данных
😃
источник

АМ

Алексей Макаров... in Python для анализа данных
Огромная подборка различных полезных сниппетов кода для Pandas. Изучайте, открывайте для себя новые примеры использования

https://vishalmnemonic.github.io/DC9/
источник

ВЛ

Владислав Литвинюк... in Python для анализа данных
Владислав Литвинюк
Спасибо, правда, на таком же этапе вчера и остановился
response_2 = response_2.dropna()
a = []
for i in response_2['tags']:
   a += i
pd.DataFrame(a)
источник

Т

Татьяна in Python для анализа данных
Алексей Макаров
Огромная подборка различных полезных сниппетов кода для Pandas. Изучайте, открывайте для себя новые примеры использования

https://vishalmnemonic.github.io/DC9/
👍😊
источник
2019 August 08

AM

Alexey Martynov in Python для анализа данных
Ребята всем привет, подскажите пожалуйста есть столбец с именами и  внем случайный пробел -" " присутствует после имени если функци которая его уберет
источник

MY

Maksim Yasinski in Python для анализа данных
а в середине есть пробел?
источник

MY

Maksim Yasinski in Python для анализа данных
может быть?
источник

А

Алексей in Python для анализа данных
Alexey Martynov
Ребята всем привет, подскажите пожалуйста есть столбец с именами и  внем случайный пробел -" " присутствует после имени если функци которая его уберет
replace?
источник

MY

Maksim Yasinski in Python для анализа данных
все пробелы или в конце?
источник

А

Алексей in Python для анализа данных
таким способом все
источник

M🌗

M 🌗🌘🌑🌒🌓... in Python для анализа данных
или strip если пробелы не нужны вообще?
источник

AM

Alexey Martynov in Python для анализа данных
один пробел в конце
источник

AM

Alexey Martynov in Python для анализа данных
случайный
источник

AM

Alexey Martynov in Python для анализа данных
В идеале бы функцию как в excel найти пробел" " заменить на пусть
источник

А

Алексей in Python для анализа данных
Alexey Martynov
один пробел в конце
если у вас всегда один случайный проблел, то вот — https://www.tutorialspoint.com/python/string_replace
источник

А

Алексей in Python для анализа данных
но данный метод уберет пробелы не только в конце, но вообще все
источник

AM

Alexey Martynov in Python для анализа данных
Спасибо опробуем
источник