те большие пользователи которые используют ваниль и форки (которые я знаю) - они не известны как компании которые активно занимаются опенсорсом, навряд ли они начнут это делать с hadoop
а какой в этом смысл ? пайплайны и замерджить данные в хранилище то не самая тяжелая операция, мягко говоря. ну есть тапустим таблички в постгрес, пусть одна эта нода не сдохла. а что дальше ? как аналитку, в реалтайм кафку кормить ?
кейс - ентерпрайз. много всяких задач, начиная со скорингов. как с постгрес всякий ML сопрягать. у нас это sparkR скриптики задачстую, т.е. на кластере гоняют и приготовление фич и саму модель
в самом постгресе нельзя, но вы для этого настраиваете небольшой AKS, там запускаете сколько хотите; ваш код обращается к ПГ по индексам, все быстро и красиво
это немножко разные проблемы, подготовка данных, обучение и скоринг - это разные части, и если вам очень необходимо распределенное обучение - то видимо PG вам не подходит