Size: a a a

2021 February 09

UD

Uncel Duk in Data Engineers
Никита
Если да, то может кто знает куда можно переехать, чтобы недорого))
На ванилу, если люди дешевые
источник

UD

Uncel Duk in Data Engineers
Либо в облачко, если дорогие
источник

AZ

Anton Zadorozhniy in Data Engineers
Никита
Если да, то может кто знает куда можно переехать, чтобы недорого))
смотря что делаете, для чего кластера используются, какая инженерная культура
источник

Н

Никита in Data Engineers
Anton Zadorozhniy
смотря что делаете, для чего кластера используются, какая инженерная культура
Прям все на минималках, отчетность, два человека, 6 нод 180ГБ 144 Cores 65TB, если я правильно понял вопрос
источник

AZ

Anton Zadorozhniy in Data Engineers
Никита
Прям все на минималках, отчетность, два человека, 6 нод 180ГБ 144 Cores 65TB, если я правильно понял вопрос
просто пайплайны, или какой-то интерактив/адхок?
источник

Н

Никита in Data Engineers
Anton Zadorozhniy
просто пайплайны, или какой-то интерактив/адхок?
Да пайплайны на аирфлоу, отчеты в суперсете через импалу, чутка спаркМЛ
источник

Н

Никита in Data Engineers
Кажется ваниллу самый верный вариант
источник

AZ

Anton Zadorozhniy in Data Engineers
кмк что угодно, объемы маленькие, видимо нагрузка не очень
источник

AZ

Anton Zadorozhniy in Data Engineers
хоть в PG
источник

AZ

Anton Zadorozhniy in Data Engineers
(правда придется переписывать)
источник

AZ

Anton Zadorozhniy in Data Engineers
ваниль с presto можно попробовать
источник

Н

Никита in Data Engineers
жаль что вообще ничего не знаю как ставить ваниллу
мне нужен то хайв спарк
источник

Н

Никита in Data Engineers
а apache bigtop что это нормуль
источник

AZ

Anton Zadorozhniy in Data Engineers
это средство для выпекания дистрибутивов
источник

AZ

Anton Zadorozhniy in Data Engineers
сильно по версиям отстает, если вы решите в ваниль идти - лучше без него
источник

Н

Никита in Data Engineers
А есть какая-нибудь мощная ссыль по установки ванилы с всеми примочками
источник

AZ

Anton Zadorozhniy in Data Engineers
обычно калякают на ансибле, или что там ваш девопс умеет
источник

R

Renarde in Data Engineers
Никита
Прям все на минималках, отчетность, два человека, 6 нод 180ГБ 144 Cores 65TB, если я правильно понял вопрос
а зачем при таком сетапе вообще ставить Hadoop? не проще ли раскатить k8s поверх этих ресурсов, minio + spark on k8s + presto + superset? Вроде для всех технологий даже helm chart-ы есть
источник

I

ILYA in Data Engineers
Anton Zadorozhniy
сильно по версиям отстает, если вы решите в ваниль идти - лучше без него
А в целом... Какие лучшие практики использования ванили? Ну там вроде нет никаких готовых средств управления типа как у клаудеры или арена даты на основе амбари или чего то аналогичного. Получается что надо ставить все самому, вручную настраивать в том числе и тот же керберос, а далее писать какие то свои утилиты для управления этим всем, так как без них я не представляю как рулить кластером на десятки/сотни нод ? Например таже выдача прав , прикрутить тот же ranger/sentry к ванили выглядит очень не простой задачей... Или может есть какие то готовые утилиты что сильно облегчают жизнь для такой задачи?
источник

Н

Никита in Data Engineers
Renarde
а зачем при таком сетапе вообще ставить Hadoop? не проще ли раскатить k8s поверх этих ресурсов, minio + spark on k8s + presto + superset? Вроде для всех технологий даже helm chart-ы есть
Спасибо, не знал о таком решении
источник