Size: a a a

2019 September 03

Ж

Жмака in Data Engineers
Grigory Pomadchin
В класспасс положил точно все что надо? Как используешь?
Скомпилировал 3 джара из исходного кода: саму библиотеку, расширение для geojson и функций хайва. Распаковал все джары и запаковал в один, потому что в синтаксисе импалы create function вроде можно только один джар прописать. Только 4 функции не создались из 84.
источник

GP

Grigory Pomadchin in Data Engineers
А они есть в сорцах?
источник

Ж

Жмака in Data Engineers
Да. В гитхабе есть, проверил в общем джаре через zipgrep - класс существует
источник

DZ

Dmitry Zuev in Data Engineers
Коллеги, кто использует k8s spark operator?
Какие есть способы дождаться выполнения джобы(batch) при деплое через helm?
источник

DZ

Dmitry Zuev in Data Engineers
wait loop через describe?
источник

GP

Grigory Pomadchin in Data Engineers
Dmitry Zuev
wait loop через describe?
ты имеешь ввиду в консоли откуда засабмитил?
источник

DZ

Dmitry Zuev in Data Engineers
Угу
источник

GP

Grigory Pomadchin in Data Engineers
spark.kubernetes.submission.waitAppCompletion
источник

GP

Grigory Pomadchin in Data Engineers
оператор держит ключ
источник

DZ

Dmitry Zuev in Data Engineers
Хм, посмотрю
источник

GP

Grigory Pomadchin in Data Engineers
Dmitry Zuev
Хм, посмотрю
источник

EN

Eldar Nezametdinov in Data Engineers
Мужики подскажите по ярну по очередям.
Есть HDP 3.1, есть Yarn, там Capacity Scheduler.
Pre-emption: true
Там допустим есть 2 queues: root.Q1, root.Q2
Q1:
absolute capacity 60%
max capacity 100%
priority 1
Q2:
absolute capacity 40%
max capacity 50%
priority 0

Изначально:
free resources 100%, Q1 0%, Q2 0%
запускаю на 50% на Q2,  итого
free resources 50%, Q1 0%, Q2 50%
запускаю на 60% на Q1, ожидаю
free resources 0%, Q1 60%, Q2 40%, получилось
free resources 0%, Q1 50%, Q2 50%
-  Почему Q1 с большим приоритетом (вроде) не забирает часть ресурсов (убивает контейнеры) у Q2 ?
источник

K

KrivdaTheTriewe in Data Engineers
Очень круто
источник

C

Combot in Data Engineers
Heru Mondal has been banned! Reason: CAS ban.
источник
2019 September 04

DZ

Dmitry Zuev in Data Engineers
чот не понимаю куда его вставить
источник

GP

Grigory Pomadchin in Data Engineers
Dmitry Zuev
чот не понимаю куда его вставить
а ты как сабмитишь?
источник

GP

Grigory Pomadchin in Data Engineers
на Гугл облаке?
источник

DZ

Dmitry Zuev in Data Engineers
helm/kubectl
источник

DZ

Dmitry Zuev in Data Engineers
Grigory Pomadchin
на Гугл облаке?
угу, в gke
источник

DZ

Dmitry Zuev in Data Engineers
kubectl get --watch --watch-only events --all-namespaces --field-selector involvedObject.kind=SparkApplication --field-selector involvedObject.name=me-spark-job |  grep -m 1 SparkApplicationCompleted
вроде таким залечил
источник