У меня, кстати, не возвращались из dead)))
Gc был криво затюнен и они уходили туда навеки
Один из самых эпиков был на 5.х клоудере когда делаешь truncate таблиц больших, они сразу выключаются, запоминается схема, удаление, создание повторно с восстановлением схемы и количеством регионов. Но при большом количестве регионов часть уже удалится, часть не успеет в указанный таймаут, команда обваливается с ошибкой, таблица оказывается в промежуточном состоянии. Основная проблема что многие операции ddl больше недоступны на кластере, так как он пытается повторять это, находит кривую таблицу и уходит на повтор. Только остановка и зачистка wal файла мастер региона спасает. Поэтому транкейт даже на дев кластере у нас запрещён был :) в 6й клоудере уже свежая hbase и ошибка там исправлена