Size: a a a

2019 September 09

ЕГ

Евгений Глотов in Data Engineers
Не, вроде нету попроще
источник

RI

Rustam Iksanov in Data Engineers
в итоге получилось так
from_unixtime(col("time").cast("long") + (col("diff") * lit(60*60) )))
источник

M

Mi in Data Engineers
Здравствуйте, немного специфический вопрос: пробовал ли кто-нибудь коннектиться к Oozie из Hive Hook через Kerberos?
источник

ЕГ

Евгений Глотов in Data Engineers
Rustam Iksanov
в итоге получилось так
from_unixtime(col("time").cast("long") + (col("diff") * lit(60*60) )))
Вместо каст лонг лучше всё-таки использовать unix_timestamp
источник

RI

Rustam Iksanov in Data Engineers
Евгений Глотов
Вместо каст лонг лучше всё-таки использовать unix_timestamp
можно разъяснить? Тут беда в том, что спарк не захотел прибавлять Int к Timestamp
источник

ЕГ

Евгений Глотов in Data Engineers
Юникс таймстемп - это тот самый таймстемп в лонге, который означает количество секунд с начала времён
источник

ЕГ

Евгений Глотов in Data Engineers
К нему можно прибавить
источник

RI

Rustam Iksanov in Data Engineers
Евгений Глотов
Юникс таймстемп - это тот самый таймстемп в лонге, который означает количество секунд с начала времён
Спс
источник

ЕГ

Евгений Глотов in Data Engineers
👍
источник

NT

Nikolay Troshnev in Data Engineers
Anton Zadorozhniy
я из команды автора Kylo, там все вокруг NiFi, могу рассказать ужасов
Антон, можешь рассказать - в Kylo есть жизнь? Раньше раз в месяц релиз был, сейчас полгода тишина...
источник

AZ

Anton Zadorozhniy in Data Engineers
Nikolay Troshnev
Антон, можешь рассказать - в Kylo есть жизнь? Раньше раз в месяц релиз был, сейчас полгода тишина...
Мы сопровождаем несколько клиентов, но в целом большинство пользователей moved on
источник

NT

Nikolay Troshnev in Data Engineers
Ок. А куда в основном?
источник

ПБ

Павел Боробов in Data Engineers
Alex
{rm_url}/ui2/index.html#/yarn-queues/root
или
{rm_url}/cluster/scheduler

на ресурсменеджере и посмотри как очереди распределены и заполнены
/yarn
источник
2019 September 10

OI

Oleg Ilinsky in Data Engineers
Привет) вопрос про хайв.
Можно ли туда вкорячить партиции по timestamp, а не по строке?
источник

A

Alex in Data Engineers
ну если сделать round до какого-то уровня
если просто timestamp то будет оооочень много партиций
источник

OI

Oleg Ilinsky in Data Engineers
не, ну там технический timestamp, по сути будет 1 партиция в день
можно сказать, date
источник

OI

Oleg Ilinsky in Data Engineers
я имею ввиду partition by (ts timestamp) чёт не работает
источник

ИШ

Игорь Шевцов in Data Engineers
Можно
источник

ИШ

Игорь Шевцов in Data Engineers
Привет
источник

ИШ

Игорь Шевцов in Data Engineers
partition(datelocal='${hiveconf:datelocal}')
источник