Size: a a a

2019 October 07

GP

Grigory Pomadchin in Data Engineers
вроде как да
источник

GP

Grigory Pomadchin in Data Engineers
откуда сабмит делаешь? с мастера?
источник

GP

Grigory Pomadchin in Data Engineers
да
источник

GP

Grigory Pomadchin in Data Engineers
источник

GP

Grigory Pomadchin in Data Engineers
со стандартным каунтером все равно падает. мне сказали надо внести изменения в спарк-енв
источник

GP

Grigory Pomadchin in Data Engineers
да
источник

GP

Grigory Pomadchin in Data Engineers
я обычный wordcount запускал и было норм
источник

GP

Grigory Pomadchin in Data Engineers
может это лишнее?
источник

GP

Grigory Pomadchin in Data Engineers
в дата инжах спроси уже, там больше людей по тематике)
источник

GP

Grigory Pomadchin in Data Engineers
лучше у своего админа
источник

GP

Grigory Pomadchin in Data Engineers
все что он мне посоветовал внести SPARK_LOCAL_IP в спарк-енв, но это не помогло
источник

GP

Grigory Pomadchin in Data Engineers
а ты уверен что у тебя ворд каунт то работал?
источник

GP

Grigory Pomadchin in Data Engineers
вернее что он у тебя работал на ярне, распределенно и не на драйвере
источник

АЖ

Андрей Жуков in Data Engineers
источник

GP

Grigory Pomadchin in Data Engineers
Андрей Жуков
поди спарком пересылал
оно теперь берет в учет порядок выделения, а не таймлайн (мож конечно так было всегда, и я не обращал внимания; да - отправил спарком через кафку)
источник

GP

Grigory Pomadchin in Data Engineers
второй раз использовал пандасы и все сколектил на дривер и отсортировал по времени
источник

A

Alex in Data Engineers
вот у меня как и по ссылке выше на стековерфлоу было похожее поведение несколько раз:

кластер в отдельной зоне и оттуда до локальной машины где делаешь spark-submit доступа нету
в зависимости от настроек файрвола может как кидать ошибку что путь не найден, так и просто на таймауте висеть
источник

A

Alex in Data Engineers
какой режим запуска делали?
источник

A

Alex in Data Engineers
снести spark_local_ip и запустить с --master yarn --deploy-mode cluster
источник

A

Alex in Data Engineers
причем в пересланом сообщении чётко видно что в клиент моде деплоите
2019-10-07 19:27:20,892 WARN util.Utils: Your hostname, sergey-HP-Laptop-15-bw0xx resolves to a loopback address: 127.0.0.1; using 10.91.51.13 instead (on interface wlp3s0)
и дальше инфа что драйвер забиндил хост/порт
источник