Size: a a a

2019 June 03

GG

George Gaál in Data Engineers
источник

GG

George Gaál in Data Engineers
а здесь пишут, что можно pyarrow.HdfsClient юзать
источник

A

Alex in Data Engineers
даже оно в доках говорит

driver ({'libhdfs', 'libhdfs3'}, default 'libhdfs') – Connect using libhdfs (JNI-based) or libhdfs3 (3rd-party C++ library from Apache HAWQ (incubating) )
источник

A

Alex in Data Engineers
источник

GG

George Gaál in Data Engineers
не совсем догоняю. Так нативного способа из питона ходить в hdfs ведь нет?
источник

GG

George Gaál in Data Engineers
libhdfs3 - с этим у меня тоже были нюансы с установкой
источник

A

Alex in Data Engineers
первая вообще запускает локально libjvm и использует java классы
вторая насколько помню чисто плюсая

в свое время первую использовал
источник

A

Alex in Data Engineers
George Gaál
не совсем догоняю. Так нативного способа из питона ходить в hdfs ведь нет?
источник

A

Alex in Data Engineers
вот он её и пытался использовать
я её видел, но никогда не использовал
источник

A

Alex in Data Engineers
как раз нативный способ, они реализовали протокол комуникации с неймнодой и датанодой
источник

GG

George Gaál in Data Engineers
Не на сишной библиотеке как обычно ? Хм
источник

A

Alex in Data Engineers
нет, именно все в питоне
источник

A

Alex in Data Engineers
https://github.com/spotify/snakebite/pull/248/files

пулреквест на третий питон

собрал свою версию и запушил в корпоративный pypi
регулярно такое делаем =)
источник

A

Alex in Data Engineers
@krivdathetriewe ленишься ты, ленишься =)
источник

K

KrivdaTheTriewe in Data Engineers
Alex
@krivdathetriewe ленишься ты, ленишься =)
Это костыль который не вошел
источник

K

KrivdaTheTriewe in Data Engineers
Есть библмотека
источник

K

KrivdaTheTriewe in Data Engineers
источник

A

Alex in Data Engineers
кстати в 2.7 в хадуп меняли протол для работы с неймнодой, там точно в одном месте int на long меняли
поэтому даже если заставите работать, то потом патчить на поддержку свежего хадупа
источник

K

KrivdaTheTriewe in Data Engineers
Alex
кстати в 2.7 в хадуп меняли протол для работы с неймнодой, там точно в одном месте int на long меняли
поэтому даже если заставите работать, то потом патчить на поддержку свежего хадупа
Проще bash вызывать из питон кода
источник

A

Alex in Data Engineers
ну для pyarrow я выше кинул линк, они заявляют что напрямую могут с hdfs работать (через одну из 2х основных либ)
источник