Size: a a a

Python для анализа данных

2019 July 31

I

Igor in Python для анализа данных
serg n.
Может быть кто-то мог бы подсказать как мне решить одну задачку?
Условие такое: всего есть 400 уникальных значений.
У каждого значения, есть частота повтора (плотность).
И также есть рейтинг от 1 до 3.
Вопрос, как гарантированно отобрать 2000 записей, чтобы туда попали все уникальные, и при этом, тем у кого рейтинг больше отдавался больший приоритет при распределении последующего балла.
К примеру статистика по 10000 записям:
Name;        Count;   Priority
Position1,   46,      3
Position2,   121,     1
Position3,   85,      3
Position4,   90,      2
..
Position400, 12,      3
--------------------------
total count:10000


и надо из них отобрать репрезентацию в 2000 позиций, чтобы примерно результат выглядел так:
Name;        Count;
Position1,   2  
Position2,   2  
Position3,   3  
Position4,   2  
..
Position400, 1  
---------------------
total count:2000
Идея есть. Но код смогу позже сбросить.
источник

I

Igor in Python для анализа данных
Суть в проекции количества записей в разрезе позиций на нужное количество с учётом рейтинга.
источник

ee

elessar elfstone in Python для анализа данных
подскажите как прочитать excel файл в df ... тока первые N колонок
источник

ee

elessar elfstone in Python для анализа данных
знаю что pandas.read_excel
источник

YP

Yuriy Prudnikov in Python для анализа данных
elessar elfstone
знаю что pandas.read_excel
источник

D

Daria Alexeenko in Python для анализа данных
elessar elfstone
знаю что pandas.read_excel
а после df.iloc и строки, которые тебе нужны)
источник

ee

elessar elfstone in Python для анализа данных
Daria Alexeenko
а после df.iloc и строки, которые тебе нужны)
все строки нужны)
источник

D

Daria Alexeenko in Python для анализа данных
elessar elfstone
все строки нужны)
ой, колонки
источник

АМ

Алексей Макаров... in Python для анализа данных
elessar elfstone
все строки нужны)
df = pd.read_excel('file.xlsx')
df.loc[:,df.columns[0:3]]
источник

ee

elessar elfstone in Python для анализа данных
спасибо!
источник

АМ

Алексей Макаров... in Python для анализа данных
👍🏻
источник

V

Vlad in Python для анализа данных
а просто df.head(N) не проще?
источник

E

Elenka in Python для анализа данных
Vlad
а просто df.head(N) не проще?
Так это ограничение на строки выводимые)
источник

V

Vlad in Python для анализа данных
Все, понял, перепутал со строками)
источник

MY

Maksim Yasinski in Python для анализа данных
добрый день!
может кто подскажет как переименовать column в pd.Series
источник

ЕД

Евгений Доронин... in Python для анализа данных
Maksim Yasinski
добрый день!
может кто подскажет как переименовать column в pd.Series
ser = pd.Series()
ser.rename("some_name")
источник

I

Igor in Python для анализа данных
df.rename(columns={"O":"n"})
источник

I

Igor in Python для анализа данных
Где O - старое, а "n" новое значение
источник

MY

Maksim Yasinski in Python для анализа данных
спасибо, вопрос тогда почему у меня не работает
источник

MY

Maksim Yasinski in Python для анализа данных
именно на series
источник