Size: a a a

2020 December 11

A

Alex in Data Engineers
Нет, это ещё норм
источник

KS

K S in Data Engineers
18 шардов х 2ГБ =36 ГБ можно наверное дельты обьединять перед добавлением нового partition.
источник

A

Anton in Data Engineers
Приветствую.
подскажите, пожалуйтса, у меня есть sequence file, внутри N строк, строка - это key - строка, value  - вектор, можно ли как-то внутри джобы хадупа сравнить каждое value c каждым другим и записать всё это в результирующий файл?
источник

AT

Al T in Data Engineers
Давайте лучше Спарк в кубике запускать, ну его этот хадуп
источник

АЖ

Андрей Жуков... in Data Engineers
Al T
Давайте лучше Спарк в кубике запускать, ну его этот хадуп
источник

S

Stanislav in Data Engineers
в смысле ну его этот ярн?
источник

ME

Max Efremov in Data Engineers
А кубер тоже может ресурсы планировать разные? Память, проц, гпу?
источник

АЖ

Андрей Жуков... in Data Engineers
Max Efremov
А кубер тоже может ресурсы планировать разные? Память, проц, гпу?
что значит “разные”?
источник

AT

Al T in Data Engineers
в смысле ну их обоих :) может конечно
источник

ME

Max Efremov in Data Engineers
Надо, наверное, уже изучить кубер. Кажется, без него скоро вообще никуда
источник

АЖ

Андрей Жуков... in Data Engineers
в энтерпрайзе - хоть куда без него
источник

АЖ

Андрей Жуков... in Data Engineers
кубы в банках и телекоме мы только лет через 5 увидим
источник

AT

Al T in Data Engineers
да я думаю мы хадуп еще внукам покажем (с коболом рядом)
источник

AZ

Anton Zadorozhniy in Data Engineers
Al T
Давайте лучше Спарк в кубике запускать, ну его этот хадуп
серверлесс спарк тут грядет, вообще без кластеров
источник

AT

Al T in Data Engineers
ну можно же уже вроде
источник

АЖ

Андрей Жуков... in Data Engineers
Anton Zadorozhniy
серверлесс спарк тут грядет, вообще без кластеров
даже без кубов?
источник

AT

Al T in Data Engineers
фаргейтушка
источник

R

Roman in Data Engineers
Андрей Жуков
кубы в банках и телекоме мы только лет через 5 увидим
Кубы уже в банках российских. Вот тоько в мире биг даты и вообще обработки данных ещё редко встречаются, но уже знаю проект в одном банке, где спарк на кубере крутится для реал тайм обработки
источник

AZ

Anton Zadorozhniy in Data Engineers
Датамеханикс есть, датабрикс свой выкатит - большинство забудет про кластера как про страшный сон
источник

AZ

Anton Zadorozhniy in Data Engineers
Al T
фаргейтушка
это очень условный серверлесс))
источник