Size: a a a

2021 May 04

GP

Grigory Pomadchin in Data Engineers
как тебе угодно
источник

BK

Brusе Kawabata in Data Engineers
Нет, я не хочу так в доке написано)
https://spark.apache.org/docs/latest/job-scheduling.html
источник

GP

Grigory Pomadchin in Data Engineers
источник

BK

Brusе Kawabata in Data Engineers
Я вроде бы сделал, как ты сейчас предложил. До старта всех джоб указал, через проперти контекста нужный планировщик и путь до XML. А в итоге в UI вижу FIFO.
источник

T

T in Data Engineers
Кстати в fair  можно же и без отдельных пулов паралелить просто на уровне тасок, да?
источник

GP

Grigory Pomadchin in Data Engineers
да там чет дефолтное да
источник

GP

Grigory Pomadchin in Data Engineers
покажи как ты засетил нужный скедулер у жобы
источник

GP

Grigory Pomadchin in Data Engineers
можн забить на пулы оно там само норм расправится
источник

GP

Grigory Pomadchin in Data Engineers
для старта ок план, согласен
источник

BK

Brusе Kawabata in Data Engineers
Сейчас
источник

T

T in Data Engineers
Ну я обычно футурами просто запускаю в fair, работает более менее ок все
источник

GP

Grigory Pomadchin in Data Engineers
ну и се)
источник

T

T in Data Engineers
Супер, просто проверил что я не делаю каких нибудь бэд практикс 😊
источник

BK

Brusе Kawabata in Data Engineers
from awsglue.context import GlueContext
from pyspark import SparkContext

glueContext = GlueContext(SparkContext.getOrCreate())
spark = glueContext.spark_session

def main():
   spark.conf.set("spark.scheduler.mode", "FAIR")
   spark.conf.set("spark.scheduler.allocation.file", "fairscheduler.xml")

   ### logic
источник

BK

Brusе Kawabata in Data Engineers
Блин, не фига не понятно.
источник

BK

Brusе Kawabata in Data Engineers
Как лучше кусок кода прислать?
источник

T

T in Data Engineers
Ты проверял доки glueчто он разрешает меня шедулер?
источник

T

T in Data Engineers
Раньше там была куча ограничений на то что ты можешь конфигурить для джобы
источник

BK

Brusе Kawabata in Data Engineers
Ага, спасибо.
Этого я не сделал. Сейчас проверю.
источник

BK

Brusе Kawabata in Data Engineers
У меня получилось создать пулы
Только теперь не пойму, почему некоторые таски в дефолтный сабмитятся?
источник