Size: a a a

Python для анализа данных

2019 June 28

A

Alexander Shatagin in Python для анализа данных
В col2 находятся поля в которых список словарей. Как их разобрать чтобы df имел вот такой вид
источник

A

Alexander Shatagin in Python для анализа данных
источник

АМ

Алексей Макаров... in Python для анализа данных
Alexander Shatagin
В col2 находятся поля в которых список словарей. Как их разобрать чтобы df имел вот такой вид
pd.concat(df['b'].apply(pd.DataFrame).tolist(), keys=df["a"]).reset_index().drop('level_1',axis=1)
источник

АМ

Алексей Макаров... in Python для анализа данных
Только нужно reset_index() сначала сделать, чтобы phrase перестала быть индексной колонкой и стала обычной
источник

АМ

Алексей Макаров... in Python для анализа данных
Колонка df['b'] - это колонка, которая содержит список словарей. Колонка df['a'] - это колонка, которая содержит phrase
источник

A

Alexander Shatagin in Python для анализа данных
Алексей Макаров
pd.concat(df['b'].apply(pd.DataFrame).tolist(), keys=df["a"]).reset_index().drop('level_1',axis=1)
thnx, пошел пробовать
источник

dd

dgj dfsh in Python для анализа данных
Здравствуйте!
Может не в тему чата. Нужна система обработки данных зависящих друг от друга, типа DAG в airflow. Например, нужно извлечь таблицу, как-то сагрегировать поля по определенным измерениям, передать агрегацию дальше, сагрегировать по другим измерениям и т.д. Т.е. выстаивается такой граф зависимостей. Сложность в том, что нужно как-то по простому (декларативно) описывать измерения и агрегации по полям (сумма, среднее, средневзвешенное, зависимости от собственных функций).
Кто-нибудь сталкивался с подобными\похожими системами\фреймворками?
источник

A

Andrei in Python для анализа данных
DVC?
источник

dd

dgj dfsh in Python для анализа данных
Andrei
DVC?
а расшифровку можно узнать?
источник

A

Andrei in Python для анализа данных
источник

dd

dgj dfsh in Python для анализа данных
самое вменяемое в выдаче - https://dvc.org/
источник

dd

dgj dfsh in Python для анализа данных
ага
источник

dd

dgj dfsh in Python для анализа данных
спасибо! изучу
источник

dd

dgj dfsh in Python для анализа данных
dgj dfsh
Здравствуйте!
Может не в тему чата. Нужна система обработки данных зависящих друг от друга, типа DAG в airflow. Например, нужно извлечь таблицу, как-то сагрегировать поля по определенным измерениям, передать агрегацию дальше, сагрегировать по другим измерениям и т.д. Т.е. выстаивается такой граф зависимостей. Сложность в том, что нужно как-то по простому (декларативно) описывать измерения и агрегации по полям (сумма, среднее, средневзвешенное, зависимости от собственных функций).
Кто-нибудь сталкивался с подобными\похожими системами\фреймворками?
Единственная статья по теме, которую я нашел, идеально описывает то, что мне в итоге надо реализовать http://www.incon.ru/services/model_sistemi_otchetnosti/. Может тут есть ее разработчики или сотрудники этой компании, а то у меня есть пару вопросов :)
источник

A

Andrei in Python для анализа данных
чем dvc не ок?
источник

dd

dgj dfsh in Python для анализа данных
Andrei
чем dvc не ок?
насколько я понял, она слишком специфична для ML, единственное, что в ней есть мне нужного - это dataflow и pipilines, но систем, реализующих это много + у них куча других плюшек (да тот же airflow). Например, я пока для себя выбрал как основу https://github.com/PrefectHQ/prefect
источник

A

Alexander Shatagin in Python для анализа данных
Алексей Макаров
pd.concat(df['b'].apply(pd.DataFrame).tolist(), keys=df["a"]).reset_index().drop('level_1',axis=1)
к сожалению не вышло, но спасибо за помощь!

Получил ошибку "ValueError: DataFrame constructor not properly called!", не справился с ней.
Ситуацию разрешил по другому, разобрал исходные словари и слепил из них список словарей с нужными айтемами, а из этого уже легко в нужном виде в df лепится.
источник
2019 June 29

KV

K V in Python для анализа данных
Добрый день. Кто сталкивался анаконда при запуске ноутбука автоматически стала его открывать в IE. Раньше все в хроме открывалось, Как восстановить ?
источник

3

3ldar in Python для анализа данных
K V
Добрый день. Кто сталкивался анаконда при запуске ноутбука автоматически стала его открывать в IE. Раньше все в хроме открывалось, Как восстановить ?
источник

KV

K V in Python для анализа данных
Спасибо. Аж стыдно стало )
источник