Size: a a a

2019 May 24

K

KrivdaTheTriewe in Data Engineers
но таблица при этом партицированна условно по dt , location,platform и прочим радостям.
источник

AP

Alexander Piminov in Data Engineers
Dynamic partitions ON ?
источник

R

Renarde in Data Engineers
KrivdaTheTriewe
но таблица при этом партицированна условно по dt , location,platform и прочим радостям.
ну в спарке скажем с этим удобно - ты создаешь таблицу через hive:
create table XXX 
Partition By (X,Y,Z)
И делаешь туда insertInto, не указывая колонок
источник

K

KrivdaTheTriewe in Data Engineers
Renarde
ну в спарке скажем с этим удобно - ты создаешь таблицу через hive:
create table XXX 
Partition By (X,Y,Z)
И делаешь туда insertInto, не указывая колонок
но я не знаю какие партиции
источник

K

KrivdaTheTriewe in Data Engineers
максимум знаю, что по dt партицировано
источник

R

Renarde in Data Engineers
эммм, show create table?)
источник

K

KrivdaTheTriewe in Data Engineers
не,  я это могу сделать, но это руками
источник

АЖ

Андрей Жуков in Data Engineers
так-то спарк insertInto делает сам
источник

K

KrivdaTheTriewe in Data Engineers
я вообще без спарка хотел бы обойтись
источник

АЖ

Андрей Жуков in Data Engineers
ааа
источник

R

Renarde in Data Engineers
Андрей Жуков
так-то спарк insertInto делает сам
кстати не совсем, нужно чтобы партицируемые колонки в конце DataFrame стояли в верном порядке
источник

АЖ

Андрей Жуков in Data Engineers
Renarde
кстати не совсем, нужно чтобы партицируемые колонки в конце DataFrame стояли в верном порядке
точно, да
источник

АЖ

Андрей Жуков in Data Engineers
ну я ему просто подсовываю select с правильным порядком
источник

R

Renarde in Data Engineers
KrivdaTheTriewe
я вообще без спарка хотел бы обойтись
вроде dynamic.partitions=on должны решать эту проблему
источник

N

Nikita Blagodarnyy in Data Engineers
Renarde
вроде dynamic.partitions=on должны решать эту проблему
Но нужно вроде указать partition(x, y, z)
источник

R

Renarde in Data Engineers
тут конечно вопрос в сторону, но если используется Hive, почему бы не использовать Spark?)
источник

N

Nikita Blagodarnyy in Data Engineers
Hive View в амбари настроил, а spark view нет. 😀
источник

K

KrivdaTheTriewe in Data Engineers
можно компактить таблички
источник

K

KrivdaTheTriewe in Data Engineers
полученные из стриминга
источник

R

Renarde in Data Engineers
а вы их в дельту из стриминга пишите, она сама все компактит - delta.io
источник