Телеграмм чат группы pydata_spb страница 57

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

PyData SPb

199 membersпожаловаться на группу

1
«
…
‹
52
53
54
55
56
57
58
›
…
»

2020 May 07

IS

Irina Saribekova in PyData SPb

Всем привет!
Помогите мне плиз, можете ответить анонимно на 6 вопросов про сообщество?
Собираю сегодня до 22:00 мск.
Если интересно, потом поделюсь статистикой =)
https://forms.gle/WEUWig4C6bKDqk9L7

Участники сообществ IT специалистов

источник

10:30пожаловаться #1

2020 May 15

J

Jukov in PyData SPb

добрый день

в рамках своей вкр разработал систему классификации на спарке на небольшом домашнем кластере. Захотелось углубиться в понимание и на набить скилуху в hadoop, spark и тд. Какие можно книги почитать на эту тему? (уже прочитал молниеносный анализ данных, hadoop for dummies(частями), и на различных ресурсах databrick и подобных поковырялся).

буду очень рад советам.

источник

14:52пожаловаться #2

I

I Апрельский... in PyData SPb

- Designing Data-Intensive Applications
- Agile Data Science 2.0

они не новые, но первая устареет не скоро, а во второй точка зрения тоже превалирует над стеком, на мой взгляд

источник

14:57пожаловаться #3

2020 June 04

E

Eugene in PyData SPb

В Pandas можно сделать такое с помощью индексации с максимальной производительностью?

df = pd.DataFrame({0: [1,5,2], 1: [4,2,3]}, index=list('abc'))

   0  1
a  1  4
b  5  2
c  2  3

# получаем серию с максимальным столбцом для каждой строки
m = df.idxmax(axis=1)

a    1
b    0
c    1

# делаем некую индексацию и получаем такой датафрейм с одним столбцом:

   0
a  4
b  5
c  3

То есть нужно вытащить в новую таблицу один столбец по argmax из исходной таблицы, для каждой строки.
Что-то я не смог это сделать сходу средствами индексации ([], loc, iloc).

В numpy я бы сделал так:

a = np.array([(1,4),(5,2),(2,3)])
array([[1, 4],
       [5, 2],
       [2, 3]])

m = a.argmax(axis=1)
array([1, 0, 1], dtype=int64)

b = a[range(a.shape[0]), m]
array([4, 5, 3])

источник

23:23пожаловаться #4

N

Nikolay in PyData SPb

В Pandas можно сделать такое с помощью индексации с максимальной производительностью?

df = pd.DataFrame({0: [1,5,2], 1: [4,2,3]}, index=list('abc'))

   0  1
a  1  4
b  5  2
c  2  3

# получаем серию с максимальным столбцом для каждой строки
m = df.idxmax(axis=1)

a    1
b    0
c    1

# делаем некую индексацию и получаем такой датафрейм с одним столбцом:

   0
a  4
b  5
c  3

То есть нужно вытащить в новую таблицу один столбец по argmax из исходной таблицы, для каждой строки.
Что-то я не смог это сделать сходу средствами индексации ([], loc, iloc).

В numpy я бы сделал так:

a = np.array([(1,4),(5,2),(2,3)])
array([[1, 4],
       [5, 2],
       [2, 3]])

m = a.argmax(axis=1)
array([1, 0, 1], dtype=int64)

b = a[range(a.shape[0]), m]
array([4, 5, 3])

а просто df.max(axis=1) чем не подходит?

источник

23:28пожаловаться #5

E

Eugene in PyData SPb

а просто df.max(axis=1) чем не подходит?

Мне нужен сам максимальный столбец (его имя/индекс). Нахожу я его в одной таблице, а данные вытащить надо из другой (с таким же row-индексом). max тут не подойдёт.

источник

23:28пожаловаться #6

N

Nikolay in PyData SPb

Мне нужен сам максимальный столбец (его имя/индекс). Нахожу я его в одной таблице, а данные вытащить надо из другой (с таким же row-индексом). max тут не подойдёт.

df.iloc[:, m] не сработает?

источник

23:34пожаловаться #7

N

Nikolay in PyData SPb

не проверял, но вдруг

источник

23:34пожаловаться #8

E

Eugene in PyData SPb

df.iloc[:, m] не сработает?

Я всё что только можно попробовал, ничего не работает так как нужно.

Конкретно этот код сделает вот такую таблицу:

Я и вот так попробовал (аналогично numpy):

df.iloc[range(m.size), m]

Сделает то же самое, что и предыдущее. То есть работает не как в numpy :)

источник

23:37пожаловаться #9

E

Eugene in PyData SPb

В numpy, например, ещё есть функция take_along_axis, с которой можно сделать то же самое примерно:

np.take_along_axis(a, m[:, np.newaxis], axis=1)
array([[4],
       [5],
       [3]])

А в pandas нет такого :) и numpy-like индексация работает не совсем так как в numpy, оказывается. Делаю вывод, что базовых методов сделать то, что я хочу в pandas нет. Печально. :)

источник

23:49пожаловаться #10

2020 June 05

E

Eugene in PyData SPb

Нашел то, что нужно. Надо использовать метод lookup.

df.lookup(m.index, m)
array([4, 5, 3], dtype=int64)

возвращает numpy-массив. Ну и дальше уже тривиально обвернуть в Series с индексом и вставить в нужную таблицу.

Как же заморочено.

источник

00:12пожаловаться #11

N

Nikolay in PyData SPb

Slozhno.gif.mp4

источник

00:18пожаловаться #12

AB

Aleksandr Borgardt in PyData SPb

Про голосйуйте за любимую технологию https://twitter.com/deunderhood/status/1268838152464216064

источник

12:37пожаловаться #13

I

I Апрельский... in PyData SPb

интересно кто ими вообще пользуется

источник

12:39пожаловаться #14

AB

Aleksandr Borgardt in PyData SPb

Cuda ?

источник

12:40пожаловаться #15

I

I Апрельский... in PyData SPb

да

источник

12:44пожаловаться #16

AB

Aleksandr Borgardt in PyData SPb

Проголосовал ?

источник

12:44пожаловаться #17

I

I Апрельский... in PyData SPb

нет

источник

12:45пожаловаться #18

I

I Апрельский... in PyData SPb

я предполагаю, что ими тут если и пользуется, то 2 человека

источник

12:46пожаловаться #19

I

I Апрельский... in PyData SPb

как раз они и проголосовали видимо

источник

12:46пожаловаться #20

1
«
…
‹
52
53
54
55
56
57
58
›
…
»