в самом способе хранения тут проблем особых нет, люди и на обычном HDFS c импалой жили хорошо, проблема в самом спарке, он тормозит, для этого они переписывают его
концепция lakehouse, если я правильно понимаю маркетинг databricks: на одном ACID-compliant storage предоставить возможность гонять не только широкие но тормозные Spark джобы, но и другие виды нагрузки (low latency, ANSI SQL, какие-то около OLTP фичи)