Size: a a a

Python для анализа данных

2019 May 22

VN

Vlad Nykytenko in Python для анализа данных
спасибо)
источник
2019 May 25

YP

Yuriy Prudnikov in Python для анализа данных
Всем привет. Вопрос следующий:
Каким образом можно получить максимальное число строк, значения которых в определенной колонке идут подряд?
Например:
id    date    value
1     01.10  a
1     02.10  a
1     04.10  a
1     05.10  b
1     06.10  a
2     .....
На выходе хочу видеть:
id    date_start    date_end    count_a
1     01.10           04.10         3
1     06.10           06.10         1
2     ......
Есть ли в pandas встроенные функции для того, чтобы считать количество значений подряд? Или все же придется в тупую циклом перебирать?
источник

АМ

Алексей Макаров... in Python для анализа данных
Попробуйте с помощью shift считать совпадает ли предыдущее значение со следующим. А потом cumsum посчитать количество подряд идущих совпадений
источник

АМ

Алексей Макаров... in Python для анализа данных
Здесь уже как-то решали похожую задачу
источник

АМ

Алексей Макаров... in Python для анализа данных
Переслано от Алексей Макаров...
источник

YP

Yuriy Prudnikov in Python для анализа данных
Благодарю
источник
2019 May 27

МК

Максим Ковтун... in Python для анализа данных
Всем привет. у меня есть вопрос. Можна как то взять  raw данные с Google Analytics. В формате id пользователя, actions(page view, event, transactions), время, и так далее?
источник

OA

Oleg Agapov in Python для анализа данных
Можно. Но это стоит $150К в год :)
источник

АМ

Алексей Макаров... in Python для анализа данных
Есть User Activity API, но там можно получить raw data только по одному пользователю за запрос, соответственно в день не более 10000 пользователей (т.к. у репортинг апи ограничение)
источник

YP

Yuriy Prudnikov in Python для анализа данных
Есть возможность брать сырые данные по каждому ClientId, но это всего 10000 запросов в день (могу ошибаться, но суть такая).
Можно выгружать данные нескольким запросами по разным дименшенам а затем мержить, но тогда вы возможно получите семплированные данные
источник

YP

Yuriy Prudnikov in Python для анализа данных
Я вообще поставил рокстат для того, чтобы сырая гугловская дата сразу ко мне в базу летела
источник

VN

Vlad Nykytenko in Python для анализа данных
Yuriy Prudnikov
Я вообще поставил рокстат для того, чтобы сырая гугловская дата сразу ко мне в базу летела
извините за глупый вопрос, не подскажите, а что такое рокстат?
источник

АМ

Алексей Макаров... in Python для анализа данных
Vlad Nykytenko
извините за глупый вопрос, не подскажите, а что такое рокстат?
источник

YP

Yuriy Prudnikov in Python для анализа данных
источник

VN

Vlad Nykytenko in Python для анализа данных
спасибо большое)
источник

EL

Elena Linker in Python для анализа данных
Максим Ковтун
Всем привет. у меня есть вопрос. Можна как то взять  raw данные с Google Analytics. В формате id пользователя, actions(page view, event, transactions), время, и так далее?
можно настроить custom dimensions со всеми нужными вам параметрами и выгружать эти данные c помощью обычного core reporting api. Симо Ахава очень подробно со всеми инструкциями описывал, как настроить такое через GTM https://www.simoahava.com/analytics/13-useful-custom-dimensions-for-google-analytics/
источник

k

k in Python для анализа данных
Это ж спам, вали его на пол, ломай ему что-нибудь!
источник

Т

Татьяна in Python для анализа данных
​​Отличный пример решения задачи анализа тональности текстов в социальных сетях на примере публикаций в Twitter во время выхода последней серии Game of Thrones (EN).

via @BigQuery
источник

МК

Максим Ковтун... in Python для анализа данных
Всем спасибо 😊
источник
2019 May 28

EK

Elena Koloskova in Python для анализа данных
#вакансия #Akvelon #Yaroslavl #USA

Всем привет, я Лена - HR из Akvelon.
Ищу Data Engineer.
Стек и описание вакансии тут https://telegra.ph/Data-Engineer-Big-Data-Developer-05-28
Релокация в город-порт США (Сиэтл).
Оплата от 90K$ в год.
По деталям пишите в лс телеграм, skype (live:koloskova_ea) и любых других мессенджерах  (+79610226292)
источник