Size: a a a

2020 January 16

АЖ

Андрей Жуков in Data Engineers
там еще и Hive у них relational
источник

A4

Anon 43 in Data Engineers
на амазоне кроме DynamoDb что-то еще можно использовать?
источник

АЖ

Андрей Жуков in Data Engineers
Anon 43
на амазоне кроме DynamoDb что-то еще можно использовать?
в EMR?..
источник

A4

Anon 43 in Data Engineers
вообще
источник

АЖ

Андрей Жуков in Data Engineers
Старый Хрыч
ну возможно, но мы людей уже перводили
ну а я людей с хадупов на аксесс переводил!
источник

СХ

Старый Хрыч in Data Engineers
Anon 43
на амазоне кроме DynamoDb что-то еще можно использовать?
ну там разные rds есть
источник

СХ

Старый Хрыч in Data Engineers
Андрей Жуков
там еще и Hive у них relational
hive же вроде отчасти могёт в sql
источник

ME

Max Efremov in Data Engineers
Anon 43
на амазоне кроме DynamoDb что-то еще можно использовать?
Монгу амазоновскую)
источник

ME

Max Efremov in Data Engineers
DocumentDB точнее)
источник

ME

Max Efremov in Data Engineers
забыл название
источник

T

T in Data Engineers
David Manukian
@usualreptiloid пробовал с таблицами хайва перезаписать (overwrite) только 1 партицию выставив spark.sql.sources.partitionOverwriteMode= dynamic - не работает,  не делай так если используешься спарк ниже 2.3)
Спасибо, хоршо что у меня 2.4.3
источник

ME

Max Efremov in Data Engineers
Max Efremov
DocumentDB точнее)
оно на 182 месте 😂
источник

A4

Anon 43 in Data Engineers
Max Efremov
DocumentDB точнее)
спасибо
источник

DT

D T in Data Engineers
Friends Anyone or anyone's friends here in google? If yes dm me😃
источник

A

Alex in Data Engineers
Anon 43
сейчас все на спарке сидят?
источник

A

Alex in Data Engineers
Если бы не нужно было никому, то не анонсили :)
источник

DM

David Manukian in Data Engineers
@usualreptiloid кстати все таки оверайдит на версиях ниже 2.3 🙂 Просто первый раз у меня почему то таблицы без партийций был поэтому всю таблицу похерил. Единственное сейчас я посмотрел последнее время апдейта всех партишн почему то меняет тоже, а не только ту партицию где был overwrite
источник

T

T in Data Engineers
👍
источник

R

Renarde in Data Engineers
Всем привет!

Вопрос - допустим у вас есть пачка spark-job в одном репозитории.
Ну то есть для одной job-ы аргументы например такие:

job1-conf.json:

{
“input_path”:”/some/input/path”,
“output_path”: “/some/output/path”
}


job2-conf.json:

{
 “input_path”:”/some/output/path”, # from the previous config
“output_path”:”/some/other/output/path”
}

Как вы управляете связанными конфигурациями в них?
Я пока вижу опции по типу jsonnet или hocon.
источник

AE

Alexey Evdokimov in Data Engineers
мы даём инпутам и джобам имена, а потом ссылаемся по полному имени типа джоб_инпут
источник