а если нужно более конкретно, то могу спросить детали у коллег, если интересны детали и конкретные проблемы. Я особо пока в эту тему не погружался, т.к. необходимости большой не было
быстрее выдавать/отбирать/масштабировать кластера, возможность шарить железо между командами и проектами, разграничение зон отвественности, упрощение обслуживания Hadoop, как платформы, Hadoop-as a Service через vRA
поэтому можно ли построить Hadoop без vSAN? Можно. Строют ли Hadoop на vSAN? Строят и достаточно часто последнее время. Зачем? Наверное, в каждом конкретном случае проблемы и задачи разные. У меня собственного опыта по этому вопросу нет, поэтому ответить точно не смогу.
ок, давай я на досуге (и не очень скоро) изучу этот вопрос и пообщаюсь с коллегами, которые делали такие проекты, а потом краткую выжимку напишу сюда. Все равно пригодиться.
Это смотря какие диски ставить, но согласен, в 1pb можно и не влезть на адекватных дисках, а не 14tb nl-sas (хотя их и можно поставить, но будет так себе).
Я б тогда на сеть поболе вложил, а то при падении диска ой ой (