Привет!
Вопрос)
Есть HDP3 со спарком. Есть докеры с airflow (это, на самом деле, не важно, главное, что это всё в докере). И у меня не получается запустить спарк джобы в cluster mode из докера на кластере.
Есть ворнинг 19/06/26 11:48:37 WARN yarn.Client: Neither spark.yarn.jars nor spark.yarn.archive is set, falling back to uploading libraries under SPARK_HOME. и различные ошибки на тему Lib not found.
Все конфиги я скачал из ambari и закинул в контейнер (SPARK, YARN, HDFS, HADOOP) и завёл переменные окружения.
Мб кто знает, нужно ли что-то ещё добавить, чтобы всё заработало?
При запуске spark-submit/spark-shell с неймноды всё ок работает и в client и в cluster модах.
тупой вопрос, все нужные джарники закинули в образ?