Size: a a a

2020 November 25

AP

Alexander Prokudin in Data Engineers
Подскажите, при работе спарка с jdbc, сетевой доступ к базе должен быть с экзекуторов или с драйвера тоже?
источник

K

KrivdaTheTriewe in Data Engineers
Alexander Prokudin
Подскажите, при работе спарка с jdbc, сетевой доступ к базе должен быть с экзекуторов или с драйвера тоже?
С драйвера тоже
источник

NN

No Name in Data Engineers
KrivdaTheTriewe
С драйвера тоже
А зачем, кстати?
источник

K

KrivdaTheTriewe in Data Engineers
No Name
А зачем, кстати?
Для сорс апи нужно
источник

K

KrivdaTheTriewe in Data Engineers
Spark.read.jdbc не ленивый
источник

РШ

Руслан Шарафутдинов... in Data Engineers
а spark.write.jdbc по этой же причине требует сетевой доступ для драйвера?
источник

N

Nikolay in Data Engineers
No Name
А зачем, кстати?
он схему определяет, например в этот момент.
источник

NN

No Name in Data Engineers
Nikolay
он схему определяет, например в этот момент.
Понял, спасибо
источник

GP

Grigory Pomadchin in Data Engineers
KrivdaTheTriewe
Spark.read.jdbc не ленивый
Жесть
источник

K

KrivdaTheTriewe in Data Engineers
Что ?
источник

K

KrivdaTheTriewe in Data Engineers
Вроде, любой ,spark.read.load не ленивый
источник

GP

Grigory Pomadchin in Data Engineers
KrivdaTheTriewe
Вроде, любой ,spark.read.load не ленивый
ды вроде да, не помню просто), плохо это
источник

DM

Dmitry Moscow in Data Engineers
Всем привет! Граждане, а кто-нибудь знает простой способ сконвертить hive Мапу в json или хотя бы в строку без udf ?
источник

А

Алексей in Data Engineers
Dmitry Moscow
Всем привет! Граждане, а кто-нибудь знает простой способ сконвертить hive Мапу в json или хотя бы в строку без udf ?
развернуть мапу в строки, а потом сагрегировать в строку:
select COLLECT_LIST(evp_col.par_name)
from events e
LATERAL VIEW explode(e.event_params) evp AS evp_col
источник

DM

Dmitry Moscow in Data Engineers
Алексей
развернуть мапу в строки, а потом сагрегировать в строку:
select COLLECT_LIST(evp_col.par_name)
from events e
LATERAL VIEW explode(e.event_params) evp AS evp_col
Спасибо, попробую!
источник

AZ

Anton Zadorozhniy in Data Engineers
В AWS завезли популярный планировщик https://aws.amazon.com/blogs/aws/introducing-amazon-managed-workflows-for-apache-airflow-mwaa/
источник

ME

Max Efremov in Data Engineers
От 250 баксов в месяц за минимальный сетап
источник

PA

Panchenko Andrey in Data Engineers
ну на гугле так же
источник

PA

Panchenko Andrey in Data Engineers
они тебе разворачивают кластер с 8 ядрами и 32 гб, и таких три тачки делают
источник

PA

Panchenko Andrey in Data Engineers
ти стоит это 10 баксов в день
источник