ну если вам хватает то наверное хорошо, но часто нужно отвечать на вопросы про то откуда данные, когда появились, когда поменялись и все такое, и тут наверное нужен какой-то датакаталог
я абсолютно согласен, и стремимся к этом, но мне кажется, что датакаталог никак не появляется из того, что кто-то руками написал ddl, но его можно получить при построении процессов , и если вы схему генерируете, то вы всегда можете построить дифф, валидировать предыдущую схему,посомтреть какая она была, сходить во внешние сервисы и сделать много кастомной логики , которая применима только к вашим данным.
опять же, если у вас меняется структура данных в спарк джобе нужно решать, нужна ли миграция старых данных и что делать дальше.