У Сережи там HBase Connector используется. Он сплитит как раз по регионом, потому я думаю что HBase Client (которые в конекторе используется) даже ничего особо группировать и не нужно
У Сережи там HBase Connector используется. Он сплитит как раз по регионом, потому я думаю что HBase Client (которые в конекторе используется) даже ничего особо группировать и не нужно
вообще кмк если есть прям большой спарковый ворклоад поверх данных hbase - мб куда-то еще эти данные писать, а то производительность это полбеды, есть же еще вопросы целостности, модели, изоляции