У кого-нибудь есть практика сжатия данных в hbase?
сжатие там настраивается в колумн фэмили когда указываешь compression
после того как указал новые данные будут жаться
старые останутся не сжатые
чтобы пожать запустить major compaction надо
в старых версиях клоудеры использовалась старая hbase (в 5.12 точно еще косяк был)
для некоторых алгоритмов которые проходят в jni из-за древнего бага в самой реализации jni парни впихнули sync секцию, в jvm 1.6 это уже было поправлено, но люди продолжают копипастить код
из-за этой секции под высокой нагрузкой на read-only таблицах у меня просадка была до 10х раз (сама таблица небольшая, но чтений на неё было очень много). отключение сжатия конечно больше сожрало на диске, но скорость заметно быстрее