Всем привет сижу на AWS glue не подскажите, 40 млн строк 43 колонки партия по часам забираю с mysql пишу в s3, период 4е дня запись предположильно 50-60 мин, это долго ?
Когда вообще не понятно, и план вроде как выглядит норм, а всё равно беда - тогда вставляю чекпоинты с персистом, чтобы понять, какой кусок кода хоть смотреть....
Всем привет, а подскажите, плз, есть ли возможность при spark-submit'е прокинуть окружение в мастер/экзекьютор, используя другие переменные окружения, которые будут определены в контейнере? Нужно что-то, зависящее от PWD контейнера
нет:( я видел в сорцах ярна, что при сабмите приложений через REST API, например, можно шаблонизацию делать, но там, вроде свой механизм. связка spark-submit <-> YARN Client, насколько я пока понял, так не умеет, вот и решил чекнуть еще раз здесь