Size: a a a

2021 August 29

Н

Никита in Moscow Spark
понятно, спасибо
источник

ЕГ

Евгений Глотов... in Moscow Spark
Но нужно учитывать, что repartition(dt) все записи с одинаковой датой запихает ровно в один таск на следующей стадии, если это стадия записи - то будет 1 файл на выходе
источник

ЕГ

Евгений Глотов... in Moscow Spark
Можно сделать repartition(dt, (rand()*5).cast("int"), тогда каждая дата раскидается случайным образом на 5 тасков, например
источник

C

Combot in Moscow Spark
Марина has been banned! Reason: CAS ban.
источник

N

Nail in Moscow Spark
А зачем делать repartition? Просто так? Каков смысл?
источник

Н

Никита in Moscow Spark
хз
источник

ПБ

Повелитель Бури... in Moscow Spark
Доброй ночи, а почему пишут что спар плох для adhoc?
источник

ЕГ

Евгений Глотов... in Moscow Spark
Спарк плох для всего)
надо же что-то делать архитекторам, а спарк и датаинженеры нарисуют)
источник

ПБ

Повелитель Бури... in Moscow Spark
?
источник

ЕГ

Евгений Глотов... in Moscow Spark
А так - 80 моих коллег аналитиков фигачили адхоки на спарке, вроде никто не жаловался
источник

ЕГ

Евгений Глотов... in Moscow Spark
Нужно подготовить минимальную инфраструктуру, конечно, хотя бы общий код запуска спарк-сессии в юпитере
источник
2021 August 30

ПБ

Повелитель Бури... in Moscow Spark
На sql или df?
источник

ЕГ

Евгений Глотов... in Moscow Spark
Кто как, многие перешли на дф
источник

ЕГ

Евгений Глотов... in Moscow Spark
Ну и такую ораву (нас всего было больше 300) надо уже разруливать очень плотно по ресурсам в ярне
источник

ЕГ

Евгений Глотов... in Moscow Spark
Чтоб всем и каждому хватало
источник

NN

No Name in Moscow Spark
Не то чтоб плох, просто минимальный порог входа относительно высок, и, помимо прочего, используется он все таки при процессинге больших данных, так что привыкшим к секундному лейтенси бывает непонятно.
Ну и накладные у него относительно приличные, та же спарк джоба не в секунду побежит тебе дела делать на кластере.
источник

ЕГ

Евгений Глотов... in Moscow Spark
В кубере вот говорят секунду)
источник

NN

No Name in Moscow Spark
Ну, видишь, я то пока в говне мамонта копаюсь в виде старого второго хадупа и ярна, мне все это непонятно и страшно.
источник

ПБ

Повелитель Бури... in Moscow Spark
А кто говорит?)
источник

ЕГ

Евгений Глотов... in Moscow Spark
В соседнем чате, наши западные коллеги)
источник