Size: a a a

Python для анализа данных

2019 March 22

АМ

Алексей Макаров... in Python для анализа данных
Один нюанс. Если у вас будет между строками происходить смена юзеров, но при этом poor будет оставаться одинаковым, то тогда shift не сработает
источник

AK

Alex Koletvin in Python для анализа данных
я во второй строке же сделал чтобы группа менялась при смене юзера
источник

АМ

Алексей Макаров... in Python для анализа данных
А точно. Не заметил
источник

A

Andrew U. in Python для анализа данных
как вы сделали nigh mood Alex
источник

АМ

Алексей Макаров... in Python для анализа данных
Тогда ок 👍🏻
источник

AK

Alex Koletvin in Python для анализа данных
Andrew U.
как вы сделали nigh mood Alex
pip install jupyterthemes
jt -t monokai -T -N -kl

вторая строка мои настройки, про установку jupyterthemes рекомендую погуглить, там могут быть нюансы
источник

k

k in Python для анализа данных
Alex Koletvin
Еще вопрос - как можно сгрппировать таблицу такого вида таким образом, что если в столбце 'poor' идет несколько значение True (или False) подряд, то эти строки аггрегировались и добавлялся столбец с протяженностью периода (то есть максимально utc_time минус минимальное).
При этом groupby['generated_id','realpurchase_count', 'poor'] не подходит, так как нужно группировать именно по идущим подряд непрерывающимся отрезкам True или False.
Писать ли функцию для этого или в чудесном пандасе можно реализовать такую задачу проще?
np.where в помощь
источник
2019 March 25

A

Anton in Python для анализа данных
Всем привет!
Друзья, кто-нибудь пользовался библиотекой для расчета т.н. пожизненной стоимости клиента (CLTV) - lifetimes
https://github.com/CamDavidsonPilon/lifetimes

Интересует, удавалось ли кому-либо получать корректные данные? Например, которые бы условно походили на данные из Аналитикса (хотя бы порядком).
источник
2019 March 26

DS

Dmitriy Shashkin in Python для анализа данных
Тем, кто мучается с matplotlib хочу сообщить что в пайтон есть относительно нормальный порт ggplot (plotnine)
источник

АМ

Алексей Макаров... in Python для анализа данных
Dmitriy Shashkin
Тем, кто мучается с matplotlib хочу сообщить что в пайтон есть относительно нормальный порт ggplot (plotnine)
Спасибо! Покопаюсь)
источник

o

olapotnikov in Python для анализа данных
Ребят, всем привет!
Может помочь кто? Нужно написать очень простую javascript функцию, которая запускает проверку логина пользователя и в случае совпадения (список из 40 логинов) запускает функцию ниже
источник

SS

Semyon Suslin in Python для анализа данных
var logins = ['vasya', 'petya'];
var currentLogin = 'vasya';

if (logins.indexOf(currentLogin) !== -1) {
 console.log('логин найден');
} else {
 console.log('логин не найден')
}
источник

SS

Semyon Suslin in Python для анализа данных
такое?
источник

o

olapotnikov in Python для анализа данных
ну типо да, только без консоль лога)
источник

OB

Oleg Basmanov in Python для анализа данных
блин. напиал функцию которая через api в цикле while по кусочкам тащит данные и потом итоговый фрейм грузит в бигквери. проблема в том чтокусочков получается больше 9к. отрабатывает за 4 часа примерно.
как это дело можно ускорить?
источник

АМ

Алексей Макаров... in Python для анализа данных
А что за АПИ?
источник

OB

Oleg Basmanov in Python для анализа данных
емарсис
источник

АМ

Алексей Макаров... in Python для анализа данных
А какая часть алгоритма больше всего времени занимает? Если данные долго из АПИ тащаться, то можно попробовать multithreading, чтобы в несколько потоков данные забирать
источник

OB

Oleg Basmanov in Python для анализа данных
ответ то быстрый. там клиентская база. сколько записей в ответе не видно. поэтому в каждом шаге цикла наращиваю offset и так пока ответ не придет пустой
источник

АМ

Алексей Макаров... in Python для анализа данных
Ну вот эту часть алгоритма можно ускроить сначала найдя сколько там записей всего, а потом распараллелив запросы с разным offset. Странно, что не отдается количество результатов в целом, но это тоже можно решить: попробовать что-нибудь вроде метода половинного деления, чтобы за несколько запросов понять сколько там всего записей
источник