Size: a a a

2019 August 09

ЕГ

Евгений Глотов in Data Engineers
🤔
источник

AZ

Anton Zadorozhniy in Data Engineers
одна из прелестей oozie - он использует для хранения всех артефактов hdfs, а для запуска yarn, а не требует как некоторые (кхе-кхе-эйрфлоу) плодить алтернативный компьют кластер и надежный сетевой сторадж
источник

ЕГ

Евгений Глотов in Data Engineers
А если мне из юпитера на питоне надо сессию поднимать
источник

AZ

Anton Zadorozhniy in Data Engineers
какой кернел?
источник

AZ

Anton Zadorozhniy in Data Engineers
и какой spawner?
источник

ЕГ

Евгений Глотов in Data Engineers
Получается, просто полный пакет spark.jars прописать
источник

A

Alex in Data Engineers
Евгений Глотов
А если мне из юпитера на питоне надо сессию поднимать
источник

A

Alex in Data Engineers
sparkmagic + livy
источник

ЕГ

Евгений Глотов in Data Engineers
Кернел питон 2/3
источник

AZ

Anton Zadorozhniy in Data Engineers
для него надо ливи поднять
источник

A

Alex in Data Engineers
так как многие oozie spark джобы закинулись и забылись,
то сейчас в проде точно больше 5 разных версий крутиться (начиная с 2.2 и до 2.4)
источник

ЕГ

Евгений Глотов in Data Engineers
Это криво работает
источник

AZ

Anton Zadorozhniy in Data Engineers
Евгений Глотов
Кернел питон 2/3
то есть pyspark для связи со спарком?
источник

A

Alex in Data Engineers
для pyspark там пару доп параметров какой питон использовать и всё, сам конфиг почти такой же
источник

ЕГ

Евгений Глотов in Data Engineers
У меня прям из кода одной функцией всё настраивается и поднимается сессия
источник

AZ

Anton Zadorozhniy in Data Engineers
Евгений Глотов
У меня прям из кода одной функцией всё настраивается и поднимается сессия
поднимается какая сессия-то?)
источник

ЕГ

Евгений Глотов in Data Engineers
SparkSession.builder.getOrCreate()
источник

AZ

Anton Zadorozhniy in Data Engineers
pyspark то есть
источник

AZ

Anton Zadorozhniy in Data Engineers
вам нужно туда где у вас ноутбук спонится положить клиента и конфиг, если например докер/куб то можно в образ
источник

AZ

Anton Zadorozhniy in Data Engineers
для спаркмэджик нужно будет поднять ливи отдельным сервисом, но тоже никто не запрещает иметь отдельные ливи для всего
источник