Size: a a a

2017 May 29

GP

Grigory Pomadchin in Data Engineers
.set в джаве / скале
источник

ὦan in Data Engineers
сейчас заново запушу
источник

GP

Grigory Pomadchin in Data Engineers
источник

AM

Aleksander Melnichnikov in Data Engineers
new SparkConf()
     .setAppName("app")
     .setExecutorEnv("spark.executor.memory", "10g") -вот так у меня в скале на тесте.
источник

ὦan in Data Engineers
так опять с хипом свалился
источник

ὦan in Data Engineers
сейчас дам 10g
источник

AM

Aleksander Melnichnikov in Data Engineers
А у меня тоже вопрос есть =)) А тут кто-нибудь на спарке занимается кластеризацией временных рядов?
источник

ὦan in Data Engineers
бля снова упал
источник

AM

Aleksander Melnichnikov in Data Engineers
Печаль. А в какой момент падает? Когда над rdd преобразования делает?
источник

ὦan in Data Engineers
Да
источник

AM

Aleksander Melnichnikov in Data Engineers
Есть вариант ограничить rdd функцией sample
источник

ὦan in Data Engineers
источник

AM

Aleksander Melnichnikov in Data Engineers
ну mkstring - это затратная походу операция
источник

AM

Aleksander Melnichnikov in Data Engineers
тебе бы ее на кластере выполнять, нужен хип огого
источник

AM

Aleksander Melnichnikov in Data Engineers
на первом этапе, где он рдд грузит, добавь вызов .sample(0.1, false)
источник

AM

Aleksander Melnichnikov in Data Engineers
он возьмет 10 процентов рдд
источник

ὦan in Data Engineers
осталось найти место первого этапа
источник

ὦan in Data Engineers
источник

ὦan in Data Engineers
я так понимаю после этой строки
источник

GP

Grigory Pomadchin in Data Engineers
Aleksander Melnichnikov
ну mkstring - это затратная походу операция
Это редьюс на драйвер
источник