Телеграмм чат группы pydata_chat страница 104

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Python для анализа данных

1463 membersпожаловаться на группу

2019 July 31

I

Igor in Python для анализа данных

Может быть кто-то мог бы подсказать как мне решить одну задачку?
Условие такое: всего есть 400 уникальных значений.
У каждого значения, есть частота повтора (плотность).
И также есть рейтинг от 1 до 3.
Вопрос, как гарантированно отобрать 2000 записей, чтобы туда попали все уникальные, и при этом, тем у кого рейтинг больше отдавался больший приоритет при распределении последующего балла.
К примеру статистика по 10000 записям:

Name;        Count;   Priority
Position1,   46,      3
Position2,   121,     1
Position3,   85,      3
Position4,   90,      2
..
Position400, 12,      3
--------------------------
total count:10000

и надо из них отобрать репрезентацию в 2000 позиций, чтобы примерно результат выглядел так:

Name;        Count;
Position1,   2  
Position2,   2  
Position3,   3  
Position4,   2  
..
Position400, 1  
---------------------
total count:2000

Идея есть. Но код смогу позже сбросить.

источник

10:58пожаловаться #1

I

Igor in Python для анализа данных

Суть в проекции количества записей в разрезе позиций на нужное количество с учётом рейтинга.

источник

11:09пожаловаться #2

ee

elessar elfstone in Python для анализа данных

подскажите как прочитать excel файл в df ... тока первые N колонок

источник

12:14пожаловаться #3

ee

elessar elfstone in Python для анализа данных

знаю что pandas.read_excel

источник

12:15пожаловаться #4

YP

Yuriy Prudnikov in Python для анализа данных

elessar elfstone

знаю что pandas.read_excel

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_excel.html

источник

12:17пожаловаться #5

D

Daria Alexeenko in Python для анализа данных

elessar elfstone

знаю что pandas.read_excel

а после df.iloc и строки, которые тебе нужны)

источник

12:25пожаловаться #6

ee

elessar elfstone in Python для анализа данных

Daria Alexeenko

а после df.iloc и строки, которые тебе нужны)

все строки нужны)

источник

12:26пожаловаться #7

D

Daria Alexeenko in Python для анализа данных

elessar elfstone

все строки нужны)

ой, колонки

источник

12:26пожаловаться #8

АМ

Алексей Макаров... in Python для анализа данных

elessar elfstone

все строки нужны)

df = pd.read_excel('file.xlsx')
df.loc[:,df.columns[0:3]]

источник

12:29пожаловаться #9

ee

elessar elfstone in Python для анализа данных

спасибо!

источник

12:29пожаловаться #10

АМ

Алексей Макаров... in Python для анализа данных

👍🏻

источник

12:29пожаловаться #11

V

Vlad in Python для анализа данных

а просто df.head(N) не проще?

источник

14:15пожаловаться #12

E

Elenka in Python для анализа данных

Vlad

а просто df.head(N) не проще?

Так это ограничение на строки выводимые)

источник

14:16пожаловаться #13

V

Vlad in Python для анализа данных

Все, понял, перепутал со строками)

источник

14:18пожаловаться #14

MY

Maksim Yasinski in Python для анализа данных

добрый день!
может кто подскажет как переименовать column в pd.Series

источник

14:21пожаловаться #15

ЕД

Евгений Доронин... in Python для анализа данных

Maksim Yasinski

добрый день!
может кто подскажет как переименовать column в pd.Series

ser = pd.Series()
ser.rename("some_name")

источник

14:23пожаловаться #16

I

Igor in Python для анализа данных

df.rename(columns={"O":"n"})

источник

14:24пожаловаться #17

I

Igor in Python для анализа данных

Где O - старое, а "n" новое значение

источник

14:24пожаловаться #18

MY

Maksim Yasinski in Python для анализа данных

спасибо, вопрос тогда почему у меня не работает

источник

14:26пожаловаться #19

MY

Maksim Yasinski in Python для анализа данных

именно на series

источник

14:27пожаловаться #20