Size: a a a

2019 October 02

C

Combot in Data Engineers
Y A has been banned! Reason: CAS ban.
источник

C

Combot in Data Engineers
ሚkey👏 Ïn ÕroMïä has been banned! Reason: CAS ban.
источник
2019 October 03

VP

Vitaly Petrov in Data Engineers
Всем привет!
Встретил такую проблему — при парсинге csv-файла pyspark-ом на локальной машине все работает отлично, а при запуске на hadoop-кластере — рассылает данные по сегментам и повисает (не пишет ничего в логи). При этом все остальное — файл и парсер — идентичны. Кто-то может подсказать, с чем это может быть связано?
источник

A

Alex in Data Engineers
а файлик где лежит?
источник

λ

λoλdog in Data Engineers
Alex
если упираешься в лимит на пользователе то даже по ssh не зайдешь =) (причем ошибка от ссш сервера неинформативна)
ну или бывает что от root зайдешь, а потом su уже не сделать, так как пользователь сидит в лимите

много веселья, но это именно если в лимит упираешься
Обычно приложения запускаются не от юзерских подьзтвптелей. Поэтому зайдёшь
источник

A

Alex in Data Engineers
проблема что иногда нужно сделать sudo в указанного пользователя
и тут ты пролетаешь

про запуск "не от юзерских пользователей" можно рассказать jupyter и его кернелам (зашли по ссш, скопировали connection_info.json, запустили процесс, особо передаём привет sparkmagic)
источник

A

Alex in Data Engineers
если это ещё и в докере запущено, то:
docker exec --it --user=нужный_юзер container bash
зайдет без проблем и даже норм команды будет выполнять (я хз откуда от лимиты в этом случае берет)

а вот такое не работает
docker exec --it --user=root container bash; su - нужный_юзер
обвалится, так как дескрипторов свободных нету
источник

A

Alex in Data Engineers
@lol_dog поэтому дескрипторы это ещё то весёлое поведение =) которое может стрелять в разных местах
источник

λ

λoλdog in Data Engineers
В случае докера их нужно передавать параметром
источник

В

Вадим in Data Engineers
λoλdog
В случае докера их нужно передавать параметром
уходи, тебе тут не рады
источник

A

Alex in Data Engineers
λoλdog
В случае докера их нужно передавать параметром
да ладно =) норм они и от родительской системы и сами трекают
источник

λ

λoλdog in Data Engineers
Берет он их с хост система с того юзера у кого запущен докер демон
источник

λ

λoλdog in Data Engineers
Скорее всего
источник

λ

λoλdog in Data Engineers
Но я бы советовал указывать явно на всякий случай
источник

A

Alex in Data Engineers
ну вот в случае exec внутрь я так и не нашел описания
а вот внутри все ок, id у пользоателя есть, внутри limits.conf есть

с хост системы хитрее как-то тянет
источник

A

Alex in Data Engineers
а демон то почти всегда от рута запущен..... докер он такой веселый
источник

λ

λoλdog in Data Engineers
Alex
а демон то почти всегда от рута запущен..... докер он такой веселый
Имхо нет
источник

λ

λoλdog in Data Engineers
Обычно создают юзера
источник

λ

λoλdog in Data Engineers
От рута наверное запускать не стоит
источник

A

Alex in Data Engineers
источник