Короче, советую провести учения и посмотреть как вводится новая datanode и rebalance на неё данные зашлет, увидите много интересного
так это регулярно, у нас больше проблем с неймнодой, 240гб в xmx и 180гб из них занято =\
сейчас смотрим на фередацию, но rbf ещё в бете, а через viewfs проблемы с поддержкой всяких питонов с их webhdfs