Size: a a a

2021 July 28

t

tenKe in Moscow Spark
не думаю, что это из-за этого
источник

А

Алексей in Moscow Spark
может подскажете настройку? set spark.sql.hive.convertMetastoreOrc = true; включено
источник

t

tenKe in Moscow Spark
скорее всего действительно векторизованное чтение или еще что-то
источник

А

Алексей in Moscow Spark
но тут даже по filesystem read data size total видно разницу
источник

t

tenKe in Moscow Spark
посмотри в spark.sql("SET -v").filter('key.contains("orc")).show()
источник

ИК

Иван Калининский... in Moscow Spark
Эх, мне бы спарк 3 на кластере(( Хотя на горизонте уже виден)
источник

AB

Alexey Belov in Moscow Spark
Вот переедем на SDP, потом можно и Spark 3 ))
источник

CO

Chern Oleksander in Moscow Spark
Всем привет
сижу на AWS glue
не подскажите, 40 млн строк 43 колонки партия по часам забираю с mysql пишу в s3, период 4е дня
запись предположильно 50-60 мин, это долго ?

8*2 воркеров
10 concurency
источник

CO

Chern Oleksander in Moscow Spark
Вроде как разошлось мнение что быстро и не быстро
Вот сам скрипт
https://pastebin.com/LJcYTyXw
Куда копать ?
источник

☭S

☭ ⤳ λ Shinkevich... in Moscow Spark
Когда вообще не понятно, и план вроде как выглядит норм, а всё равно беда - тогда вставляю чекпоинты с персистом, чтобы понять, какой кусок кода хоть смотреть....
источник
2021 July 29

D

Dmitry in Moscow Spark
Всем привет, а подскажите, плз, есть ли возможность при spark-submit'е прокинуть окружение в мастер/экзекьютор, используя другие переменные окружения, которые будут определены в контейнере? Нужно что-то, зависящее от PWD контейнера
источник

V

Vlad in Moscow Spark
источник

D

Dmitry in Moscow Spark
нет:(
я видел в сорцах ярна, что при сабмите приложений через REST API, например, можно шаблонизацию делать, но там, вроде свой механизм. связка spark-submit <-> YARN Client, насколько я пока понял, так не умеет, вот и решил чекнуть еще раз здесь
источник
2021 July 30

М

Михаил in Moscow Spark
Добрый день, кто то сталкивался с расширением sparkmagic на jupyter, spark-livy годится для эксплуатации?
источник

A

Alex in Moscow Spark
да, используем активно
источник

A

Alex in Moscow Spark
проблема только в том что для третьего спарка ливи нужно из мастера собирать
источник

A

Alex in Moscow Spark
релиза вроде ещё не было
источник

М

Михаил in Moscow Spark
а керберос подключали в него?
источник

A

Alex in Moscow Spark
да
источник

A

Alex in Moscow Spark
стоит за керберосом, хадуп тоже с керберосом
источник