Size: a a a

2019 July 18

OB

Oleg Basmanov in Data Engineers
Спасибо!
источник

S

Stanislav in Data Engineers
神風
Всем привет. Использовал ли кто-нибудь snakeyaml в своих spark джобах? Встречались ли с ошибкой парсинга по причине class not found exception?
Подкинь новую версию
источник

神風 in Data Engineers
Stanislav
Подкинь новую версию
Да в том то и дело, загадочная ситуация. Включили ACLи на YARNe лишились возможности смотреть историю, поковыряли настройки job history server, выставили везде *, не заработало. Откатили назад как было. И теперь все etlи с конфигами в виде yml файликов, которые работали раньше, перестали работать.
источник

神風 in Data Engineers
Причём это не один jarник это 10ки разных.
источник

VS

Valeriy Shinkevich in Data Engineers
Mikhail Butalin
Народ, запущенную джобу в шедуллере можно как-то ограничить по ресурсам на лету? А то у меня один деятель стартанул джобу и забил всё ИО на кластере :(
А что за джоба - то ? 😊
источник

KM

Konstantin Markov in Data Engineers
神風
Да в том то и дело, загадочная ситуация. Включили ACLи на YARNe лишились возможности смотреть историю, поковыряли настройки job history server, выставили везде *, не заработало. Откатили назад как было. И теперь все etlи с конфигами в виде yml файликов, которые работали раньше, перестали работать.
После включения acl в hdfs на каталог /tmp/logs прав у mapred'a хватало? Ну или если вы меняли путь, то не /tmp/logs 😊
источник

神風 in Data Engineers
Konstantin Markov
После включения acl в hdfs на каталог /tmp/logs прав у mapred'a хватало? Ну или если вы меняли путь, то не /tmp/logs 😊
Не, там проблема была  вот в чем. Когда в Web морде ярна пытались посмотреть логи упавшего джоба, то стала вылетать ошибка доступа для dr.who. Я так понимаю, что aclи в ярне - это вещь абстрактная, не имеющая к файловой системе отношения. Проблема доступа именно к соответствующему ресурсу web сервера.
источник

神風 in Data Engineers
Но сейчас беспокоит не это, в первую очередь надо понять причину почему вдруг snakeyaml в jobaх работал а потом вдруг перестал.
источник

EN

Eldar Nezametdinov in Data Engineers
Дата инженеры. Есть очень мелкий тестовый кластер из 3х машин (мастер, 2 воркера).
Реплика фактор 2, но нет уверенности в том, что когда добавился второй воркер изначально реплика фактор был 2.
Подскажите последовательность действий, чтобы удалить 2ой воркер. (мастер и 1ый воркер отксалировали вертикально)
Там мастер еще наркоманский, на нем запускаются джобы и имеет диск для хранения данных (для hdfs).
источник

MB

Mikhail Butalin in Data Engineers
Valeriy Shinkevich
А что за джоба - то ? 😊
Уже разобрался. KYLIN оборзел.
источник

AZ

Anton Zadorozhniy in Data Engineers
Eldar Nezametdinov
Дата инженеры. Есть очень мелкий тестовый кластер из 3х машин (мастер, 2 воркера).
Реплика фактор 2, но нет уверенности в том, что когда добавился второй воркер изначально реплика фактор был 2.
Подскажите последовательность действий, чтобы удалить 2ой воркер. (мастер и 1ый воркер отксалировали вертикально)
Там мастер еще наркоманский, на нем запускаются джобы и имеет диск для хранения данных (для hdfs).
кластер чего? HDFS?
источник

EN

Eldar Nezametdinov in Data Engineers
Anton Zadorozhniy
кластер чего? HDFS?
hdp (hdfs, etc..)
источник

EN

Eldar Nezametdinov in Data Engineers
ну да проблема с тем, как отключить ноду правильно, не потерять данные... ни разу не делал, гугл не подсказал нормально..
была бы реплика 3, 40 машин, одну бы удалили и не парились вообще, а тут всего 2 датаноды, фактор 2 сейчас..
источник

AZ

Anton Zadorozhniy in Data Engineers
то есть вы хотите снизить репликацию до 1 и при этом боитесь потерять данные?
источник

EN

Eldar Nezametdinov in Data Engineers
там мелкие данные < 5Тб, конечно, не хочется ничего терять, есть диски на мастере и воркере... просто хочется перенести ...
источник

AZ

Anton Zadorozhniy in Data Engineers
1) поставить RF1 всем данным
2) декоммисовать нужную датаноду
источник

АЖ

Андрей Жуков in Data Engineers
Anton Zadorozhniy
1) поставить RF1 всем данным
2) декоммисовать нужную датаноду
3) страдать
источник

AZ

Anton Zadorozhniy in Data Engineers
мда
источник

АЖ

Андрей Жуков in Data Engineers
Я только не понял, в чем проблема. Нужно убрать датаноду, или паника в том, что какие-то данные могут быть с RF < 2?
источник

EN

Eldar Nezametdinov in Data Engineers
второе верно, есть данные RF1 сейчас
источник