Size: a a a

Python для анализа данных

2019 June 03

АМ

Алексей Макаров... in Python для анализа данных
А вот, например, в случае если передаем list of dicts, то колонки называть не нужно, т.к. названия колонок уже в ключах словарей
источник

ВЛ

Владислав Литвинюк... in Python для анализа данных
Алексей Макаров
А вот, например, в случае если передаем list of dicts, то колонки называть не нужно, т.к. названия колонок уже в ключах словарей
А зачем так указывать  columns=columns ?
Насколько я понял, это выбрать все столбцы
источник

АМ

Алексей Макаров... in Python для анализа данных
А где вы увидели пример с columns=columns?
источник

ВЛ

Владислав Литвинюк... in Python для анализа данных
Алексей Макаров
А где вы увидели пример с columns=columns?
не помню, код такой:
from sklearn.preprocessing import Imputer
imputer = Imputer(missing_values='NaN', strategy='mean', axis=0, verbose=0, copy=True)
imputer.fit(df_train)
df_train = imputer.transform(df)
df_train = pd.DataFrame(df, columns=columns)


я чтобы заработало написал без второго параметра
columns
источник

АМ

Алексей Макаров... in Python для анализа данных
Теперь понял. Это какое-то немного извращенное применение синтаксиса для выбора только определенных колонок
источник

АМ

Алексей Макаров... in Python для анализа данных
Сначала там было где-то объявление columns. Например, columns = ['a','b']
источник

АМ

Алексей Макаров... in Python для анализа данных
И затем, используя выражение pd.DataFrame(df, columns=columns) можно оставить только колонки 'a' и 'b'
источник

АМ

Алексей Макаров... in Python для анализа данных
Но это очень странно
источник

АМ

Алексей Макаров... in Python для анализа данных
Ведь можно оставить нужные колонки через выражение df[['a','b']]
источник

ВЛ

Владислав Литвинюк... in Python для анализа данных
Алексей Макаров
Ведь можно оставить нужные колонки через выражение df[['a','b']]
вот и я думаю также
источник

ВЛ

Владислав Литвинюк... in Python для анализа данных
А зачем указывать 2 df?
[[1,2],[3,4]], columns=[a,b]
источник

АМ

Алексей Макаров... in Python для анализа данных
источник

АМ

Алексей Макаров... in Python для анализа данных
Это не 2 df. Это один из способов создать датафрейм
источник

ВЛ

Владислав Литвинюк... in Python для анализа данных
А понял, спасибо большое
Похоже не инсерт в  sql
источник

b

bacchus in Python для анализа данных
Скорее всего будет мимо, но кто нибудь работал с rabbitmq?
источник
2019 June 04

DS

Dmitriy Shashkin in Python для анализа данных
Про последнюю статью в канале: phantom js же вроде мертв. А вообще рекомендую посмотреть в сторону splash, если не важен 100% точный рендеринг css, с помощью splash можно быстрее, проще и более полноценно спарсить большие объёмы
источник

АМ

Алексей Макаров... in Python для анализа данных
Да, действительно разработку прекратили 😔
источник

A

Andrei in Python для анализа данных
зато есть headless браузеры
источник

АМ

Алексей Макаров... in Python для анализа данных
Dmitriy Shashkin
Про последнюю статью в канале: phantom js же вроде мертв. А вообще рекомендую посмотреть в сторону splash, если не важен 100% точный рендеринг css, с помощью splash можно быстрее, проще и более полноценно спарсить большие объёмы
Splash+Scrapy выглядит интересной связкой. Спасибо, буду пробовать!
источник

ОН

Олег Новиков... in Python для анализа данных
Лучше использовать headless браузеры. Их всегда можно переключать в разные режимы видимости ( по крайней мере Хром).
Со связкой Splash+Scrapy пока не знаком, нужно будет глянуть. Спасибо.
источник