Size: a a a

Python для анализа данных

2019 February 06

AK

Alex Koletvin in Python для анализа данных
Переслано от pavel kovtun
всегда когда всплывает вопрос про скорость пандас, универсальный совет - конвертируй в numpy
источник

AK

Alex Koletvin in Python для анализа данных
Переслано от Doker
И сделал бы df.loc[select, :]
источник

AK

Alex Koletvin in Python для анализа данных
Переслано от Doker
Выдаёт новый df потом впаиваешь
источник

AK

Alex Koletvin in Python для анализа данных
Переслано от Doker
Select задай булеанский параметр
источник

AK

Alex Koletvin in Python для анализа данных
Переслано от pavel kovtun
навскидку - убираешь из таблицы все == 0, потом оперируешь разницей в индексах значений
источник

AK

Alex Koletvin in Python для анализа данных
Моя функция через sum().searchsorted(0,side='right') обсчитывается неприлично долго, думаю поиграться с вариантом
"убираешь из таблицы все == 0, потом оперируешь разницей в индексах значений"
источник

АМ

Алексей Макаров... in Python для анализа данных
@koletvin Получилось через stack, а потом несколько разных кумулятивных функций
источник

АМ

Алексей Макаров... in Python для анализа данных
Решение не очень элегантное
источник

АМ

Алексей Макаров... in Python для анализа данных
Но работает
источник

АМ

Алексей Макаров... in Python для анализа данных
Сейчас кину
источник

АМ

Алексей Макаров... in Python для анализа данных
источник

AK

Alex Koletvin in Python для анализа данных
Спасибо, посмотрю как сработает для 150 тысяч строк)
источник

АМ

Алексей Макаров... in Python для анализа данных
Отпишитесь потом)
источник

АМ

Алексей Макаров... in Python для анализа данных
Интересный кейс получился, думаю даже сделаю позже в блог пост с объяснением решения задачи
источник

АМ

Алексей Макаров... in Python для анализа данных
источник

АМ

Алексей Макаров... in Python для анализа данных
Там у меня в предыдущем файле небольшая ошибочка, где stacked_df['activity'] = stacked_df['day'].astype(int)
источник

АМ

Алексей Макаров... in Python для анализа данных
Там вместо day должен быть activity
источник

AK

Alex Koletvin in Python для анализа данных
Учту, спасибо
источник

АМ

Алексей Макаров... in Python для анализа данных
Dmitriy Klimakov
Привет народ, подскажите ,а есть на питоне чтото удобное и хорошо работающее для выделения ключевых слов в коротких текстах ?
Есть вот такая штука https://github.com/igor-shevchenko/rutermextract
источник

AK

Alex Koletvin in Python для анализа данных
Да, быстро и круто работает, спасибо, хотя странно, что для такой задачи вроде не самой необычной сложно придумать более простой способ.
В том же голом питоне такое сделать (со списком списков например) не проблема, но к большим датасетам конечно такой подход не особо применим)
источник