Size: a a a

2021 October 21

AK

Alex Krash in Data Engineers
hdfs dfs -lsr | sort )
Так в двух местах, и через diff получить разность
источник

N

Nikita Blagodarnyy in Data Engineers
А есть у кого-нибудь живой пример практического применения Apache Arrow в народном хозяйстве? Для чего он юзается? Написать свой спарк?
источник

OI

Oleg Ilinsky in Data Engineers
to_pandas? или что-то серьёзное?
источник

N

Nikita Blagodarnyy in Data Engineers
Я не знаю, я хочу понять.
источник

ЕГ

Евгений Глотов... in Data Engineers
pandas_udf
источник

OI

Oleg Ilinsky in Data Engineers
ну дсы когда ту пандас делают, если использовать arrow, то сильно лучше
и pandas_udf, да
источник

OI

Oleg Ilinsky in Data Engineers
наверное, есть примеры поинтереснее, но у меня нет)
источник

ИК

Иван Калининский... in Data Engineers
Dremio вот использует.
И на смартдате я спрашивал докладчика оттуда, что и как можно сделать с данными, но реляционки не умеют отдавать в Arrow Flight, поэтому пока я не вижу, как бы применить с пользой(
источник

ЕГ

Евгений Глотов... in Data Engineers
Это уже достаточно интересно, скорость иксджибуста повышена вдвое)
источник

N

Nikita Blagodarnyy in Data Engineers
to_pandas это что-то на пуспарковом?
источник

OI

Oleg Ilinsky in Data Engineers
да) конвертация из spark dataframe в pandas dataframe
источник

OI

Oleg Ilinsky in Data Engineers
а потом можно уже чё-нибудь обучать
источник

N

Nikita Blagodarnyy in Data Engineers
Я оттуда же и стал интересоваться.
источник

ИК

Иван Калининский... in Data Engineers
У Andy Pavlo в курсе CMU был слайд, где Arrow наравне с RDMA по скорости передачи данных. RDMA дорого, arrow открытый. Казалось бы, все должны за arrow топить, но всё ещё не вижу с ним большого количества продуктов
источник

AZ

Anton Zadorozhniy in Data Engineers
пока не умеют 😊
источник

N

Nikita Blagodarnyy in Data Engineers
А что они делают? Жава объекты трансформируют в арров и применяют к нему уже арровные трансформации?
источник

OI

Oleg Ilinsky in Data Engineers
Да, только потом применяют питонячьи трансформации
источник

OI

Oleg Ilinsky in Data Engineers
Типа с эрроу можно работать жабой, питоном, сями и всем остальным.
источник

OI

Oleg Ilinsky in Data Engineers
и, что важно - это всё будет векторно
источник

GP

Grigory Pomadchin in Data Engineers
в контексте паркета как мемори маппед файл можно использовать его а некоторых случаях что круто

мож конечно не так круто как хотелось бы но вот оно так
источник