Худи уж точно не легаси не разу, он много где есть. Тот же убер, который его разработал, его юзает в своем фича сторе, и свои задачи этот формат выполняет, он считается особенно подходящим в ситуациях, когда есть множество стриминговых источников. Дельта без дельта энжн, имхо, куда менее полезна. Ну а уж про то, зачем нужен айсберг - он выполняет задачу хранения и обработки огромных датасетов с большим количеством партиций, одна из его основных фишек - умение делать листинг за константное время, а не за линейное, например. И поднимается он в кластере не сложнее, чем дельта. Худи не поднимал, но сомневаюсь, что там есть большие сложности с тем, чтобы его накатить. Насчёт insert/update/delete - тот же айсберг это умеет делать. Другое дело, что пока что он умеет это делать только на уровне файлов, но за счёт структуры метаданных он это делает достаточно быстро. Но в разработке сейчас апиха, которая будет на уровне строк эти операции выполнять.
Я бы рекомендовал не зацикливаться на дельте - они отлично пиарят свои решения в комьюнити, но они серебряной пулей не могут являться, и покрывают определенное количество кейсов при определенных условиях.