Size: a a a

2019 July 10

MB

Mikhail Butalin in Data Engineers
в основном HBASE и ORCи
источник

MB

Mikhail Butalin in Data Engineers
мелочи нет совсем. дак хадупу же мелочь противопоказана
источник
2019 July 11

A

Alex in Data Engineers
Mikhail Butalin
512гб рам а ноде
я правильно понял: вам 512гб не хватило памяти в неймноде на 30тб ?
источник

VZ

Vitali Z in Data Engineers
я обычно придерживаюсь совета
At capacity, with the recommended allocation of 1 GB of memory per million blocks
Но обычно на webui  NN видно скок она потребляет
источник

VZ

Vitali Z in Data Engineers
источник

L

Lamobot in Data Engineers
А какой размер блока используете?
источник

MB

Mikhail Butalin in Data Engineers
Alex
я правильно понял: вам 512гб не хватило памяти в неймноде на 30тб ?
нет. нам нехватило heap 2GB
источник

MB

Mikhail Butalin in Data Engineers
...вообще чем больше я погружаюсь в хадуп тем чаще делаю вывод что с точки зрения разработки он офигенен
источник

MB

Mikhail Butalin in Data Engineers
...авот сточки зрения производительности и эксплуатации - полное ГОВНИЩЕ
источник

S

Stanislav in Data Engineers
глупости какие то
источник

S

Stanislav in Data Engineers
не делай такие выводы
источник

A

Alex in Data Engineers
он и с разработки такой же как в эксплуатации =)
источник

MB

Mikhail Butalin in Data Engineers
ну хз...
источник

MB

Mikhail Butalin in Data Engineers
Stanislav
глупости какие то
Ну смотри... Вчера у меня парадеятелей нагнули кластер запустив job. А вот поменять приоритет этого джоба никак налету нельзя... В итоге трифты на hbase выпилились пока нагрузка на ИО 90% была
источник

MB

Mikhail Butalin in Data Engineers
они тупо не работали всё это время
источник

MB

Mikhail Butalin in Data Engineers
Я к тому что гибкости в системе никакой
источник

S

Stanislav in Data Engineers
твоя претензия какая-то слабая
в хадупчике есть много спорных решений, а уж если пытаться использовать его как серебряную пулю то ваще жесть - но вот про дележку ресурсов, пф
иди подели их на любом решении без облака
хочешь о таком не думать - добро пожаловать в сноуфлейк, он тебе развернет столько мощи, сколько надо, лишь бы денег хватило
источник

IK

Ilya Karpov in Data Engineers
Mikhail Butalin
Ну смотри... Вчера у меня парадеятелей нагнули кластер запустив job. А вот поменять приоритет этого джоба никак налету нельзя... В итоге трифты на hbase выпилились пока нагрузка на ИО 90% была
про гибкость и hbase,  видимо вы не разделили хосты на которых batch job была и hbase крутился? или там была нагрузка на скан hbase?
источник

MB

Mikhail Butalin in Data Engineers
там джоба, запущенная через ярн, выполняла в TEZ работу с таблицей hbase на всех регион серверах
источник

MB

Mikhail Butalin in Data Engineers
какой-то insert, если верить TEZ'y
источник