Size: a a a

2021 October 11

GP

Grigory Pomadchin in Moscow Spark
кстати рибята тут спрашивали а что использовать если не скопт или скаллоп -> https://live.jugru.org/video?v=MTAwMTAyiiM2OTgzijA
источник

GP

Grigory Pomadchin in Moscow Spark
ну все теперь дистейдж юзать буду в спарках эх
источник

ПФ

Паша Финкельштейн... in Moscow Spark
деклайн же!
источник

GP

Grigory Pomadchin in Moscow Spark
все так!
источник

GP

Grigory Pomadchin in Moscow Spark
Паша смотрит все толки, очень достойно
источник

GP

Grigory Pomadchin in Moscow Spark
ппц
источник

VI

Vladimir Ilyushkin in Moscow Spark
Народ вы кто нибудь использует этот параметр при чтении spark.sql.files.maxPartitionBytes.
Пытался применить что бы понять как работает не получается.

sparl.sql('set spark.sql.files.maxPartitionBytes=209715200')
df=spark.sql("""select * from table""")
df.rdd.getnumpartitions()

Выводит: 200, Я так понимаю, это то, что по умолчанию уставлено в spark.sql.shuffle.partitions.
Как я понял из гугла, если правильно использовать можно эффективней читать.
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Чего не так?
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Я честно говорю не помнил что в толке
источник

GP

Grigory Pomadchin in Moscow Spark
это был комплемент
источник

GP

Grigory Pomadchin in Moscow Spark
))
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Аааа
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Я помнил что мне больше всего понравилось
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Как ваш доклад прошёл?
источник

GP

Grigory Pomadchin in Moscow Spark
хорошо
источник

GP

Grigory Pomadchin in Moscow Spark
спасибо за площадку, мне понравилось
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Ура :) Как тебе роль эксперта?
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Приходи выступать!
источник

GP

Grigory Pomadchin in Moscow Spark
странное название ток эксперта) но площадка хорошая
источник

GP

Grigory Pomadchin in Moscow Spark
приду!
источник