Телеграмм чат группы hadoopusers страница 13

ну если это облако то скорее всего там есть своя возможность разворачивать кластер, это сократит часы на обслуживание кластера; и будет удобно настраивать конфигурации; можно будет сосредоточиться на настройках самого хадупо кластера а не на оркестровке

(пример emr, cf)
---------

на железе придется самим приватность сетки поддерживать (если локалки не достаточно), самим оркестровкой заниматься и обновлением кластера;
за то чисто в теории может быстрее работать, если весь кластер будет в стойках которые рядом и общаются по очень широкой локалке

источник

15:36пожаловаться #5

Grigory Pomadchin in Data Engineers

но в реальности, я не пробовал оценивать проихводительность обоих подходов

источник

15:38пожаловаться #6

Grigory Pomadchin in Data Engineers

в плане сравнивать скажем 10 нод на хетцнере // или 10 нод emr

источник

15:38пожаловаться #7

Grigory Pomadchin in Data Engineers

а там чем больше машин надо; у физ машин начинают появляться ограничения простарнственные; к примеру они могут поставить их во дном датацентре но не могут поставить их рядом;

источник

15:39пожаловаться #8

Vitaliy Okulov in Data Engineers

emr все таки выделенное облако, тут больше вопрос был поднять ноды на том же EC2

источник

15:39пожаловаться #9

Grigory Pomadchin in Data Engineers

а; разницы никакой

источник

15:39пожаловаться #10

Vitaliy Okulov in Data Engineers

или в России у ИТГрад

источник

15:39пожаловаться #11

Grigory Pomadchin in Data Engineers

я б не стал в россии поднимать)

источник

15:40пожаловаться #12

Vitaliy Okulov in Data Engineers

проект русский, аудитория в России

источник

15:40пожаловаться #13

Grigory Pomadchin in Data Engineers

ну попробуй; разница где нету; есть разница железки это или готовая инфраструктура

источник

15:41пожаловаться #14

Grigory Pomadchin in Data Engineers

у меня 2 года назад на хецнере была проблема, что локалку между машинами в одном датацентре протолкнуть не могли; нод было не так много - 10 воркеров и 1 мастер

источник

15:42пожаловаться #15

Grigory Pomadchin in Data Engineers

и вот этот мастер был не рядом и не в локалке; и он был хорошим ботелнеком ;\

источник

15:42пожаловаться #16

Vitaliy Okulov in Data Engineers

жестоко

источник

15:43пожаловаться #17

Grigory Pomadchin in Data Engineers

и почемут любил падать :D