Anastasiya Esiunina
подскажите, кто-нибудь, как-нибудь тюнил msck repair table в hive? час висит, партиции по дням за 4 года, не знаю много ли это..
Час это многовато, я видел, партиции по часам (ааааа!!) за пару лет несколько часов обновлялись, но отработали
После этого случая я пробовал перевести на параллельное выполнение alter table add/drop partition (scala/Spark), на больших объёмах было примерно до полутора раз быстрее, но функция заметно сложнее, чем msck repair, на который можно положиться в любом случае, поэтому не стал заморачиваться и удалил эту ветку. Внутреннюю реализацию msck repair не менял, не видел, не знаю