Телеграмм чат группы datasciencechat страница 7236

Size: a a a

Data Science Chat

5162 membersпожаловаться на группу

2021 November 30

Вадим in Data Science Chat

В статье этого не напишут, данные у всех оазные

источник

12:55пожаловаться #1

Alex K in Data Science Chat

Для сотовой связи они не супер разные. На самом деле я нашел несколько, но думал вдруг что-то очень стоящее ещё есть

источник

12:57пожаловаться #2

Georgiy Ashkar in Data Science Chat

Всем, доброго дня!
Подскажите, пожалуйста!
Есть таблица с кучей столбцов, мне нужно только 3 из них. Можно выкидывать через. drop, а можно ли просто "удалить все кроме"?

источник

13:37пожаловаться #3

Georgiy Ashkar in Data Science Chat

Или оставить как-то только 3 нужных?

источник

13:38пожаловаться #4

Ssv in Data Science Chat

df[df[[col1, col2, col3]]]

источник

13:39пожаловаться #5

Andrey in Data Science Chat

df[['column1', 'column2']]

источник

13:40пожаловаться #6

Georgiy Ashkar in Data Science Chat

Большое спасибо всем!

источник

13:44пожаловаться #7

Igor Danilov in Data Science Chat

Всем привет.

Подскажите, чем лучше кластеризовать данные в высокоразмерном пространстве (n=150) ?

Использую PROCLUS отсюда: https://github.com/cmmp/pyproclus но сомневаюсь в его пригодности для такого числа измерений (в оригинальной статье n был равен 10)

Но ищу также и другие способы.

GitHub

GitHub - cmmp/pyproclus: A python implementation of PROCLUS: PROjected CLUStering algorithm.

A python implementation of PROCLUS: PROjected CLUStering algorithm. - GitHub - cmmp/pyproclus: A python implementation of PROCLUS: PROjected CLUStering algorithm.

источник

14:20пожаловаться #8

Boris Sirotin in Data Science Chat

если "нужно" возникает на этапе открытия файла, то есть параметр usecols чтобы загружать только нужные столбцы

pd.read_csv('filename.csv', usecols=['column1', 'column2', 'column3'])

в pandas.read_excel также этот параметр есть

источник

14:36пожаловаться #9

Georgiy Ashkar in Data Science Chat

Супер. Спасибо большое!

источник

14:37пожаловаться #10

Denis Stadnik in Data Science Chat

Привет. Накидайте идей. Есть снэпшоты игроков в онлайн игре, которые делаются после определенных событий. Задача понять какие события или состояния игрока предшествуют покупке определенного предмета(эти события тоже есть). В снэпшоте хранится инфа о тригере снэпшота, количество различных валют, уровень игрока и тд.

источник

14:39пожаловаться #11

Denis Stadnik in Data Science Chat

Пока создал датафрейм со снепшотами, которые были ближе всего к покупке необходимого предмета. Кластеризовал, выделил средние каждого кластера.

источник

14:41пожаловаться #12

Georgiy Ashkar in Data Science Chat

Подскажите ещё, плз.
Как объяснить панде, что некоторые данные и есть nan?

источник

14:41пожаловаться #13

Boris Sirotin in Data Science Chat

https://pandas.pydata.org/docs/reference/api/pandas.read_excel.html

смотрите описание для na_values

источник

14:42пожаловаться #14

Georgiy Ashkar in Data Science Chat

Благодарю!

источник

14:43пожаловаться #15

Darina in Data Science Chat

Всем привет. Ворвусь в ваш содержательный канал с небольшой просьбой.
Мы (ЦСП "Платформа" и Аналитический центр при Правительстве РФ) делаем исследование об удовлетворенности специалистов ИИ условиями работы в России. И будем признательны, если вы уделите около 12 минут и пройдете опрос: http://ai-survey.ru/
Ваша оценка текущих условий и мер господдержки поможет разработать эффективные инструменты для создания благоприятных условий работы ИИ-сообщества в России. В целом если есть какие-то пожелания, но при прохождении опроса вам почему-то не удастся их высказать, можете написать мне в личку и я постараюсь все учесть при написании аналитики. И да, данные будут в обобщенным виде, публичны и мы сможем поделиться итоговым продуктом (запрос на него тоже можно написать в личку). Спасибо

ai-survey.ru

Социологический опрос об удовлетворённости условиями работы в сфере ИИ в РФ

Удовлетворенность условиями работы в России граждан, заинтересованных в развитии технологий искусственного интеллекта. Масштабный социологический опрос начинающих специалистов и профессионалов в сфере искусственного интеллекта.

источник

14:49пожаловаться #16

Georgiy Ashkar in Data Science Chat

Если ещё не утомил😅

Я выделил из df, только нужно мне колонки, но при сохранении в csv он добавляет ещё столбец с номером строки, как от этого избавиться?

источник

14:54пожаловаться #17

Oleg Shapovalov in Data Science Chat

index=False

источник

14:57пожаловаться #18

Georgiy Ashkar in Data Science Chat

Спасибо!
А то я 2 файла сохранял едино образно, но в одном почему-то записались индексы строк.
Благодарю!

источник

14:58пожаловаться #19

Andrey in Data Science Chat

поищите по слову user2vec

источник

15:00пожаловаться #20