Size: a a a

Python для анализа данных

2019 February 12

АМ

Алексей Макаров... in Python для анализа данных
Можно конечно всё это наваять на pandas, но решение через циклы будет выглядеть проще и понятнее
источник

R

Roman in Python для анализа данных
Oleg Agapov
это похоже на pivot(). в строках и столбцах product_name, а в значениях count()
Ваше решение даст только диагональную матрицу с кол-вом конкретного товара.
источник

OA

Oleg Agapov in Python для анализа данных
а, точно, прошу пардон
источник

R

Roman in Python для анализа данных
Oleg Agapov
а, точно, прошу пардон
Все равно спасибо за попытку помочь, я на десять минут был уверен что у вас все круто и четенько :)
источник

АМ

Алексей Макаров... in Python для анализа данных
Я правильно понимаю, что вам из вот такого:
источник

АМ

Алексей Макаров... in Python для анализа данных
Надо сделать вот такое:
источник

АМ

Алексей Макаров... in Python для анализа данных
источник

АМ

Алексей Макаров... in Python для анализа данных
источник

АМ

Алексей Макаров... in Python для анализа данных
Судя по всему вот решение, которое нужно. Но блин... это всё на пандас превращается в дикую разверзень. Хотя, работать должно быстрее, чем циклы на больших объемах
источник

АМ

Алексей Макаров... in Python для анализа данных
Самая засада в том, что пандас не умеет мерджить два датафрейма по ключам, которые представляют из себя множества. И приходится множества приводить к тексту, а затем мерджить по тексту, что выглядит пипец каким костылем
источник

АМ

Алексей Макаров... in Python для анализа данных
Да и запихивание множеств в пандасовский датафрейм тоже выглядит достаточно убогенько)
источник

АМ

Алексей Макаров... in Python для анализа данных
Но зато всё работает)
источник

R

Roman in Python для анализа данных
Алексей, спасибо за участие. Тоже кажется что костыль, я попробую докрутить ваше решение, но сходу у вас матрица получилась какая то другая) я даже несовсем осознал почему именно такая. В вашей матрице должно быть, что товар всегда с собой участвует в заказе, т.к. в ячейке [DT,DT] = 3, а не NaN.
Но в целом да, через множества вроде эффективней..
источник

АМ

Алексей Макаров... in Python для анализа данных
Да. У меня {DT, DT} пары вообще нет. Потому что combinations(df.item_id.unique(),2) даёт только уникальные сочетания SKU. Кажется через combinations можно сделать и повторяющиеся сочетания, типа {DT, DT}, {JK, DT}, {DT, JK}
источник

АМ

Алексей Макаров... in Python для анализа данных
Мой же алгоритм в pairs генерирует только {DT, JK} как одну уникальную пару
источник

АМ

Алексей Макаров... in Python для анализа данных
Либо combinations тут не подходят и нужны permutations (тоже из collections)
источник
2019 February 13

AR

Alyona Rykova in Python для анализа данных
источник

AR

Alyona Rykova in Python для анализа данных
Добрый день! Никто не сталкивался с ошибкой:"python setup.py egg_info" failed with error code 1 in C:\Users\", при выполении  "py -m pip install pandas" в command prompt? Спасибо заранее!
источник

DS

Dmitriy Shashkin in Python для анализа данных
Попробуйте в конце -v  к команде дописать, мб будет больше информации о проблеме
источник

DS

Dmitriy Shashkin in Python для анализа данных
Тут вот советуют обновить pip и поставить/обновить setuptools https://stackoverflow.com/questions/35991403/pip-install-unroll-python-setup-py-egg-info-failed-with-error-code-1
источник