Size: a a a

2020 November 18

ME

Mikhail Epikhin in Data Engineers
Там можно отдельно создать сессию и тогда SparkDriver будет висеть вечно
источник

ME

Mikhail Epikhin in Data Engineers
Max Efremov
Да фиг знает, там 4 ec2 машины, ожидаю, что в очередь построятся, если сразу не могут все
ну так и должно быть, они должны просто в accepted висеть и все
источник

ME

Mikhail Epikhin in Data Engineers
покажите выхлоп
yarn application -list -appStates ALL
источник

ME

Max Efremov in Data Engineers
ssh в кластер нет(
источник

ME

Max Efremov in Data Engineers
попробую через зеплин сейчас
источник

A

Alex in Data Engineers
Max Efremov
Да фиг знает, там 4 ec2 машины, ожидаю, что в очередь построятся, если сразу не могут все
насколько помню порядок ливи:
засабмитили джобу
она закинула джобу в кластер (запустив spark submit из консоли)
ожидает запуска в самом ярне
если не запустилось за указанной промежуток то киляет по таймауту

дальше могут появиться настройки самого yarn:
на одного пользователя не выдавать больше Х cpu/mem
один пользователь не может запускать более чем N задач

если вы видете ошибку с ресурсами, то скорее всего это второе, а не таймауты
источник

ME

Max Efremov in Data Engineers
Там ярн ругался:
WARN YarnScheduler: Initial job has not accepted any resources; check your cluster UI to ensure that workers are registered and have sufficient resources
Вот такое часа 3 висело в логах от ливи
источник

A

Alex in Data Engineers
когда ресурсов в кластере нету обычно джобы в accepted влетают
в вот при достижении лимитов как раз таки ошибка падает
источник

ME

Max Efremov in Data Engineers
Т.е. не ошибка, но долго висело, потом отвалилось
источник

A

Alex in Data Engineers
ну тут вопрос поднялся кластер или нет
источник

A

Alex in Data Engineers
так как похоже что ресурс менеджер стартанул
а нодаменеджеры не отчитались
источник

ME

Max Efremov in Data Engineers
Кластер уже месяц как работает, не тушится
источник

A

Alex in Data Engineers
так а в ui что?
источник

A

Alex in Data Engineers
распределение по очередям и какая утилизация кластера?
источник

AZ

Anton Zadorozhniy in Data Engineers
с такими возможностями кмк проще пересоздать кластер
источник

Д

Дмитрий in Data Engineers
dynamic allocation = off?
источник

ME

Max Efremov in Data Engineers
Дмитрий
dynamic allocation = off?
Это из конфига ярна?
источник

Д

Дмитрий in Data Engineers
источник

Д

Дмитрий in Data Engineers
= отдавать ресурсы когда они уже не нужны.
источник

АЖ

Андрей Жуков... in Data Engineers
насколько я помню, в ливи оно с трудом пробрасывается
источник