Size: a a a

2019 April 23

MB

Mikhail Butalin in Data Engineers
У кого-нибудь есть практика сжатия данных в  hbase?
источник

MB

Mikhail Butalin in Data Engineers
Я смотрю вроде есть такая опция. А то у меня на кластере место заканчивается :(
источник

A

Alex in Data Engineers
Mikhail Butalin
У кого-нибудь есть практика сжатия данных в  hbase?
сжатие там настраивается в колумн фэмили когда указываешь compression
после того как указал новые данные будут жаться
старые останутся не сжатые
чтобы пожать запустить major compaction надо

в старых версиях клоудеры использовалась старая hbase (в 5.12 точно еще косяк был)
для некоторых алгоритмов которые проходят в jni из-за древнего бага в самой реализации jni парни впихнули sync секцию, в jvm 1.6 это уже было поправлено, но люди продолжают копипастить код

из-за этой секции под высокой нагрузкой на read-only таблицах у меня просадка была до 10х раз (сама таблица небольшая, но чтений на неё было очень много). отключение сжатия конечно больше сожрало на диске, но скорость заметно быстрее
источник

A

Alex in Data Engineers
источник

A

Alex in Data Engineers
-  // HACK - Use this as a global lock in the JNI layer.

то есть даже если кодек сам тредсейф, то парни писали все кодеки по подобию с первым и просто копипастой оно разошлось =(
источник

A

Alex in Data Engineers
в 6й клоудере это уже пофишкено (слова консультанта клоудеры еще за год до выхода 6й  клоудеры, что в их ветках он нашел этот бекпорт)
источник

MB

Mikhail Butalin in Data Engineers
ого, ясно, спасибо за информацию
источник

sn

serg n. in Data Engineers
а Hadoop Yarn и packet manager Yarn для ноды это разные вещи?
источник

SB

Sergey Buyalsky in Data Engineers
serg n.
а Hadoop Yarn и packet manager Yarn для ноды это разные вещи?
абсолютно
источник

GG

George Gaál in Data Engineers
serg n.
а Hadoop Yarn и packet manager Yarn для ноды это разные вещи?
Нормальные названия для софта закончились
источник

GG

George Gaál in Data Engineers
Сфинксов, например, тоже два
источник

MS

Mike 🔥🔥 Salnikov in Data Engineers
и чая как минимум два
источник

sn

serg n. in Data Engineers
Mike 🔥🔥 Salnikov
и чая как минимум два
это как в том анекдоте? ту ти ту ту - мол, два чая во второй номер
источник

MS

Mike 🔥🔥 Salnikov in Data Engineers
serg n.
это как в том анекдоте? ту ти ту ту - мол, два чая во второй номер
это как тестовый движок в джсе и гошный роутер)
источник

GG

George Gaál in Data Engineers
Mike 🔥🔥 Salnikov
и чая как минимум два
Я знаю нодовский
источник

MS

Mike 🔥🔥 Salnikov in Data Engineers
источник

GP

Grigory Pomadchin in Data Engineers
хорошо что про апаче 2 хттп сервер который не стали спрашивать
источник

MS

Mike 🔥🔥 Salnikov in Data Engineers
они пишутся немного по-разному
источник

MS

Mike 🔥🔥 Salnikov in Data Engineers
но читаются одинаково
источник

sn

serg n. in Data Engineers
а как новичку начать в hadoop под винду? лучше виртуалку Cloudera поставить?
источник