Size: a a a

2020 January 21

DG

Denis Gabaydulin in Data Engineers
Mikhail Butalin
Интересно, у всех ambari metrics collector жрёт память по конски. или я такой счастливый один...
А всякие TTL настроены?
источник

DG

Denis Gabaydulin in Data Engineers
В крайнем случае можно всегда сделать heap dump и посмотреть, если есть подозрения на leak.
источник

VS

Vladislav 👻 Shishkov in Data Engineers
Mikhail Butalin
Интересно, у всех ambari metrics collector жрёт память по конски. или я такой счастливый один...
у нас была вроде такая проблема точечно, но решение не помню, вроде в логах должен быть ответ
источник
2020 January 22

DM

David Manukian in Data Engineers
Кто знает есть ли способ удаления hive parititons по range? Я знаю что есть, но почему то у меня все мои способы не получаются. Я использую spark 2.1 и hive 1.*
источник

DM

David Manukian in Data Engineers
Или хотя бы как то чекать сущесвует ли партиция boolean какой нибудь
источник

РП

Роман Пашкевич in Data Engineers
David Manukian
Кто знает есть ли способ удаления hive parititons по range? Я знаю что есть, но почему то у меня все мои способы не получаются. Я использую spark 2.1 и hive 1.*
Удаляю партиции в спарке циклом. Даже если партиции нет, ошибки не происходит и цикл продолжается.
источник

РП

Роман Пашкевич in Data Engineers
А, потому что там написано у меня IF EXISTS
источник

РП

Роман Пашкевич in Data Engineers
У меня партиция по дням.

#Drop partition
print('Drop partition')
for b in i_date_s:
   
   start_date=b.strftime("%Y-%m-%d")
   drop="""ALTER TABLE   scheme.table DROP IF EXISTS PARTITION ( partition ='""" + start_date + """')"""
   sql(drop)
источник

DM

David Manukian in Data Engineers
@RomanPashkevich у меня if exists не было, поэтому ошибку бросало)
источник

DM

David Manukian in Data Engineers
@RomanPashkevich Я тоже ничего не нашел, поэтому начал циклом удалять. Понятно, спасибо
источник

D

Dmitry Tron in Data Engineers
источник

DM

David Manukian in Data Engineers
@dmtron у меня хайв той же версии, но у меня не работает так
источник

DM

David Manukian in Data Engineers
@dmtron спасибо, я просто прошелся по циклу
источник

D

Dmitry Tron in Data Engineers
Пожалуйста.
источник

C

Combot in Data Engineers
Добро пожаловать в самое дружелюбное комьюнити.
источник

DM

David Manukian in Data Engineers
Можно ли как то сделать distcp на scala? у меня очень много и сложных путей которые динамически строятся, надо перетащить файлы из этих путей, консольно не получится, очень долго придется мучиться.
источник

PA

Polina Azarova in Data Engineers
можно сгенерировать строчку скалой и дальше вызвать из баша уже готовую :)
ну или потыкать апишку
источник

DM

David Manukian in Data Engineers
@e7suK07e7su не, это чересчур)
источник

DM

David Manukian in Data Engineers
@e7suK07e7su не хочу просто на spark'e это писать, думал просто перекинуть как-нибудь файлы, но я как понимаю другого варианта кроме как spark'a нет
источник

UD

Uncel Duk in Data Engineers
источник