Телеграмм чат группы hadoopusers страница 1964

@usualreptiloid пробовал с таблицами хайва перезаписать (overwrite) только 1 партицию выставив spark.sql.sources.partitionOverwriteMode= dynamic - не работает, не делай так если используешься спарк ниже 2.3)

Спасибо, хоршо что у меня 2.4.3

источник

15:42пожаловаться #11

Max Efremov in Data Engineers

Max Efremov

DocumentDB точнее)

оно на 182 месте 😂

источник

15:43пожаловаться #12

Anon 43 in Data Engineers

Max Efremov

DocumentDB точнее)

спасибо

источник

15:44пожаловаться #13

D T in Data Engineers

Friends Anyone or anyone's friends here in google? If yes dm me😃

источник

16:22пожаловаться #14

Alex in Data Engineers

Anon 43

сейчас все на спарке сидят?

https://blog.cloudera.com/announcing-support-for-apache-flink-with-the-ga-of-cloudera-streaming-analytics/

Cloudera Blog

Announcing support for Apache Flink with the GA of Cloudera Streaming Analytics - Cloudera Blog

Announcing support for @apacheflink with the GA of Cloudera Streams Management on Cloudera Data Platform Data Center #Flink

источник

16:29пожаловаться #15

Alex in Data Engineers

Если бы не нужно было никому, то не анонсили :)

источник

16:29пожаловаться #16

David Manukian in Data Engineers

@usualreptiloid кстати все таки оверайдит на версиях ниже 2.3 🙂 Просто первый раз у меня почему то таблицы без партийций был поэтому всю таблицу похерил. Единственное сейчас я посмотрел последнее время апдейта всех партишн почему то меняет тоже, а не только ту партицию где был overwrite

источник

17:19пожаловаться #17

T in Data Engineers

👍

источник

17:20пожаловаться #18

Renarde in Data Engineers

Всем привет!

Вопрос - допустим у вас есть пачка spark-job в одном репозитории.
Ну то есть для одной job-ы аргументы например такие:

job1-conf.json:

{
 “input_path”:”/some/input/path”,
 “output_path”: “/some/output/path”
}

job2-conf.json:

{

 “input_path”:”/some/output/path”, # from the previous config
 “output_path”:”/some/other/output/path”
}

Как вы управляете связанными конфигурациями в них?
Я пока вижу опции по типу jsonnet или hocon.

источник

17:30пожаловаться #19

Alexey Evdokimov in Data Engineers

мы даём инпутам и джобам имена, а потом ссылаемся по полному имени типа джоб_инпут

источник

17:51пожаловаться #20