Телеграмм чат группы hadoopusers страница 1660

21:12пожаловаться #1

Combot in Data Engineers

ሚkey👏 Ïn ÕroMïä has been banned! Reason: CAS ban.

23:39пожаловаться #2

2019 October 03

Vitaly Petrov in Data Engineers

Всем привет!
Встретил такую проблему — при парсинге csv-файла pyspark-ом на локальной машине все работает отлично, а при запуске на hadoop-кластере — рассылает данные по сегментам и повисает (не пишет ничего в логи). При этом все остальное — файл и парсер — идентичны. Кто-то может подсказать, с чем это может быть связано?

20:04пожаловаться #3

а файлик где лежит?

20:55пожаловаться #4

Alex

если упираешься в лимит на пользователе то даже по ssh не зайдешь =) (причем ошибка от ссш сервера неинформативна)
ну или бывает что от root зайдешь, а потом su уже не сделать, так как пользователь сидит в лимите

много веселья, но это именно если в лимит упираешься

Обычно приложения запускаются не от юзерских подьзтвптелей. Поэтому зайдёшь

21:01пожаловаться #5

проблема что иногда нужно сделать sudo в указанного пользователя
и тут ты пролетаешь

про запуск "не от юзерских пользователей" можно рассказать jupyter и его кернелам (зашли по ссш, скопировали connection_info.json, запустили процесс, особо передаём привет sparkmagic)

21:03пожаловаться #6

если это ещё и в докере запущено, то:
docker exec --it --user=нужный_юзер container bash
зайдет без проблем и даже норм команды будет выполнять (я хз откуда от лимиты в этом случае берет)

а вот такое не работает
docker exec --it --user=root container bash; su - нужный_юзер
обвалится, так как дескрипторов свободных нету

21:07пожаловаться #7

@lol_dog поэтому дескрипторы это ещё то весёлое поведение =) которое может стрелять в разных местах

21:08пожаловаться #8

В случае докера их нужно передавать параметром

21:10пожаловаться #9

Вадим in Data Engineers

λoλdog

В случае докера их нужно передавать параметром

уходи, тебе тут не рады

21:10пожаловаться #10

λoλdog

В случае докера их нужно передавать параметром

да ладно =) норм они и от родительской системы и сами трекают

21:11пожаловаться #11

Берет он их с хост система с того юзера у кого запущен докер демон

21:11пожаловаться #12

Скорее всего

21:11пожаловаться #13

Но я бы советовал указывать явно на всякий случай

21:12пожаловаться #14

ну вот в случае exec внутрь я так и не нашел описания
а вот внутри все ок, id у пользоателя есть, внутри limits.conf есть

с хост системы хитрее как-то тянет

21:13пожаловаться #15

а демон то почти всегда от рута запущен..... докер он такой веселый

21:13пожаловаться #16

Alex

а демон то почти всегда от рута запущен..... докер он такой веселый

Имхо нет