Size: a a a

2019 July 18

GP

Grigory Pomadchin in Data Engineers
神風
spark.authenticate = false и snakeyaml в джобах снова работает.
а сикрет был выставлен?
источник

神風 in Data Engineers
Grigory Pomadchin
а сикрет был выставлен?
?
источник

GP

Grigory Pomadchin in Data Engineers
spark.authenticate.secret
источник

神風 in Data Engineers
Grigory Pomadchin
spark.authenticate.secret
Нет находит такого параметра в configuration cdh5. 13
источник

GP

Grigory Pomadchin in Data Engineers
источник

O

Oleg in Data Engineers
Anton Zadorozhniy
1) поставить RF1 всем данным
2) декоммисовать нужную датаноду
как в этом случае быть уверенным что данные окажутся не ноде которую надо будет убрать?
источник

O

Oleg in Data Engineers
или во время дексомиссии данные с этой ноды перераспределятся по оставшимся?
источник

AZ

Anton Zadorozhniy in Data Engineers
Oleg
как в этом случае быть уверенным что данные окажутся не ноде которую надо будет убрать?
процесс декомиссии ноды вычисляет какие блоки с этой ноды надо будет перенести на другие и переносит
источник

A

Alex in Data Engineers
@pomadchin после установки ноды на декомиссию проходят шаги:

1) нода переводится в read only
2) для всех блоков которые находятся только на той ноже делается копия где-то ещё

В принципе уже после этого шага можно выключать её, но в нормальной стратегии там ещё шаг

3) для всех блоков которые есть на той ноде делается плюс одна копия ещё где-то (то есть временно при расчёте реплика фактора копии на той ноде не считаются)

После этого нода выключается, реплики на ней становятся недоступны, но за счёт избыточности на шаге 3 ты как проставил "хочу иметь 2 реплики" , то и после выключения получишь этих же 2 реплики
источник

A

Alex in Data Engineers
То есть после удаления ноды нету состояния: все пропало, востанавливаем уровень репликации, иначе ещё одна машинка упадёт и мы в.....
источник

AZ

Anton Zadorozhniy in Data Engineers
там были еще какие-то параметры вроде числа тредов для репликации..
источник

UD

Uncel Duk in Data Engineers
декомишн скучно
можно просто вырубить же
источник

UD

Uncel Duk in Data Engineers
источник

A

Alex in Data Engineers
Anton Zadorozhniy
там были еще какие-то параметры вроде числа тредов для репликации..
Это уже тюнинг чтобы быстрее проходило :)
источник

AZ

Anton Zadorozhniy in Data Engineers
и да, еще один повод держать аккуратно назначенные стойки к узлам, и системно бороться с маленькими блоками
источник

AZ

Anton Zadorozhniy in Data Engineers
(если вам надо много декомиссовать - можно запускать декомиссию сразу для нескольких узлов из одной стойки, и чем меньше маленьких файлов - тем быстрее декомиссия)
источник

GP

Grigory Pomadchin in Data Engineers
Alex
@pomadchin после установки ноды на декомиссию проходят шаги:

1) нода переводится в read only
2) для всех блоков которые находятся только на той ноже делается копия где-то ещё

В принципе уже после этого шага можно выключать её, но в нормальной стратегии там ещё шаг

3) для всех блоков которые есть на той ноде делается плюс одна копия ещё где-то (то есть временно при расчёте реплика фактора копии на той ноде не считаются)

После этого нода выключается, реплики на ней становятся недоступны, но за счёт избыточности на шаге 3 ты как проставил "хочу иметь 2 реплики" , то и после выключения получишь этих же 2 реплики
наверное не меня ты меншонить хотел
источник

GP

Grigory Pomadchin in Data Engineers
источник

A

Alex in Data Engineers
Да, извиняюсь, хотел @goshailigoga
источник

K

KrivdaTheTriewe in Data Engineers
Ребят , было такое у кого , что в hdp 3.0.1 select запрос содержащий фильтр по стринг колонке (не из париции) подвисал после эксплейна и никуда на исполнение не отправлялся( нет ярн джобы)
А вот условно create temporary table as as select точно такой же отрабатывал ?
источник