Всем привет. Возможно глупый вопрос, но все же. Предположим, что есть кластер. Я написал новый алгоритм для
spark.ml, который хранится у меня локально. Далее я написал программу в apache toree, в которой использую свой новый алгоритм. Вопрос - будет ли работа такой программы работать распределено? Нужно ли мне заранее добавить этот файлик на каждую ноду?
И вообще, как обычно работают с кастомизацией спарка в кластере?
PS: если есть ссылки/статьи, то с радостью изучу