Size: a a a

2019 June 29

GP

Grigory Pomadchin in Data Engineers
можно попробовать в ярн клаент моуде запуститься, что-то мне кажется что драйвером будет твоя машина как и всегда а екзекуторы на ярне вращатсья будут
источник

GP

Grigory Pomadchin in Data Engineers
только тебе нужен роутинг до всех нод
источник

GP

Grigory Pomadchin in Data Engineers
и что-бы они совпадали со своими именами внутренней сети
источник

ЕГ

Евгений Глотов in Data Engineers
Не, я не про это
источник

ЕГ

Евгений Глотов in Data Engineers
Подключиться к уже запущенному, а не запускать новый
источник

AN

Artem Nazarenko in Data Engineers
Евгений, я правильно понимаю, что к спарку, запущенному в режиме локал, либо ярн подключаться  вот так (master("spark://IP_OF_MY_REMOTE_SERVER:7077") нельзя. А если его запустить в standalone mode, то тада можно? Да?
источник

AN

Artem Nazarenko in Data Engineers
Григорий, спасибо за ответ!  Увы, нифига не понял(( Что значит "твоя машина в этом случае станет драйвером"? моя машина и так в одной сетке. Более того спарк тоже на моей машине, но сидит в виртуалке (yarn mode)
источник

GP

Grigory Pomadchin in Data Engineers
Евгений Глотов
Подключиться к уже запущенному, а не запускать новый
почему? ярн кластер поднят, легко подключиться к нему, тачка будет вне кластера а экзекуторы будут на ярне
источник

GP

Grigory Pomadchin in Data Engineers
Artem Nazarenko
Григорий, спасибо за ответ!  Увы, нифига не понял(( Что значит "твоя машина в этом случае станет драйвером"? моя машина и так в одной сетке. Более того спарк тоже на моей машине, но сидит в виртуалке (yarn mode)
и приложение и ярн на одной виртуалке?
источник

ЕГ

Евгений Глотов in Data Engineers
Grigory Pomadchin
почему? ярн кластер поднят, легко подключиться к нему, тачка будет вне кластера а экзекуторы будут на ярне
Я про подключение к поднятой сессии, так, как попытался сделать Артём, это работает только со стэндэлоун
источник

ЕГ

Евгений Глотов in Data Engineers
Если сессия ярн запустилась, то к ней уже никак не подберёшься)
источник

GP

Grigory Pomadchin in Data Engineers
а как будет приложение это запушенно?
источник

GP

Grigory Pomadchin in Data Engineers
тестирование на локальной машине с поднятным клатсером на другой можно

на локалке поднимается драйвер и запускает ‘джобу’ на ярне
источник

GP

Grigory Pomadchin in Data Engineers
не нужен никакой спарк-сабмит в этом случае
источник

GP

Grigory Pomadchin in Data Engineers
это не будет подключение к сессии это будет новая сессия
источник

ЕГ

Евгений Глотов in Data Engineers
Вот это работает без проблем, когда на локальном у нас есть хадуп-сайт, ярн-сайт, хайв-сайт конфиги, скачанные из ноды кластера
источник

GP

Grigory Pomadchin in Data Engineers
ну это уже вопрос конфигурации
источник

GP

Grigory Pomadchin in Data Engineers
их тоже не надо качать и никуда прокидывать; достаточно в конфиг продублировать конфиги кластера
источник

GP

Grigory Pomadchin in Data Engineers
можно и в рантайме
источник

GP

Grigory Pomadchin in Data Engineers
т.е. это логика приложения (может ею быть)
источник