Size: a a a

Data Science Chat

2021 November 30

В

Вадим in Data Science Chat
В статье этого не напишут, данные у всех оазные
источник

AK

Alex K in Data Science Chat
Для сотовой связи они не супер разные. На самом деле я нашел несколько, но думал вдруг что-то очень стоящее ещё есть
источник

GA

Georgiy Ashkar in Data Science Chat
Всем, доброго дня!
Подскажите, пожалуйста!
Есть таблица с кучей столбцов, мне нужно только 3 из них. Можно выкидывать через. drop, а можно ли просто "удалить все кроме"?
источник

GA

Georgiy Ashkar in Data Science Chat
Или оставить как-то только 3 нужных?
источник

S

Ssv in Data Science Chat
df[df[[col1, col2, col3]]]
источник

A

Andrey in Data Science Chat
df[['column1', 'column2']]
источник

GA

Georgiy Ashkar in Data Science Chat
Большое спасибо всем!
источник

ID

Igor Danilov in Data Science Chat
Всем привет.

Подскажите, чем лучше кластеризовать данные в высокоразмерном пространстве (n=150) ?

Использую PROCLUS отсюда: https://github.com/cmmp/pyproclus но сомневаюсь в его пригодности для такого числа измерений (в оригинальной статье n был равен 10)

Но ищу также и другие способы.
источник

BS

Boris Sirotin in Data Science Chat
если "нужно" возникает на этапе открытия файла, то есть параметр usecols чтобы загружать только нужные столбцы

pd.read_csv('filename.csv', usecols=['column1', 'column2', 'column3'])

в pandas.read_excel также этот параметр есть
источник

GA

Georgiy Ashkar in Data Science Chat
Супер. Спасибо большое!
источник

DS

Denis Stadnik in Data Science Chat
Привет. Накидайте идей. Есть снэпшоты игроков в онлайн игре, которые делаются после определенных событий. Задача понять какие события или состояния игрока предшествуют покупке определенного предмета(эти события тоже есть). В снэпшоте хранится инфа о тригере снэпшота, количество различных валют, уровень игрока и тд.
источник

DS

Denis Stadnik in Data Science Chat
Пока создал датафрейм со снепшотами, которые были ближе всего к покупке необходимого предмета. Кластеризовал, выделил средние каждого кластера.
источник

GA

Georgiy Ashkar in Data Science Chat
Подскажите ещё, плз.
Как объяснить панде, что некоторые данные и есть nan?
источник

BS

Boris Sirotin in Data Science Chat
https://pandas.pydata.org/docs/reference/api/pandas.read_excel.html

смотрите описание для na_values
источник

GA

Georgiy Ashkar in Data Science Chat
Благодарю!
источник

D

Darina in Data Science Chat
Всем привет. Ворвусь в ваш содержательный канал с небольшой просьбой.
Мы (ЦСП "Платформа" и Аналитический центр при Правительстве РФ) делаем исследование об удовлетворенности специалистов ИИ условиями работы в России. И будем признательны, если вы уделите около 12 минут и пройдете опрос: http://ai-survey.ru/
Ваша оценка текущих условий и мер господдержки поможет разработать эффективные инструменты для создания благоприятных условий работы ИИ-сообщества в России. В целом если есть какие-то пожелания, но при прохождении опроса вам почему-то не удастся их высказать, можете написать мне в личку и я постараюсь все учесть при написании аналитики. И да, данные будут в обобщенным виде, публичны и мы сможем поделиться итоговым продуктом (запрос на него тоже можно написать в личку). Спасибо
источник

GA

Georgiy Ashkar in Data Science Chat
Если ещё не утомил😅

Я выделил из df, только нужно мне колонки, но при сохранении в csv он добавляет ещё столбец с номером строки, как от этого избавиться?
источник

OS

Oleg Shapovalov in Data Science Chat
index=False
источник

GA

Georgiy Ashkar in Data Science Chat
Спасибо!
А то я 2 файла сохранял едино образно, но в одном почему-то записались индексы строк.
Благодарю!
источник

A

Andrey in Data Science Chat
поищите по слову user2vec
источник