Size: a a a

2021 March 01

AZ

Anton Zadorozhniy in Data Engineers
No Name
Вот я тоже самое спросил, а меня проигнорили (
Так а чем хадуп не устраивает?
источник

AZ

Anton Zadorozhniy in Data Engineers
Nikita Blagodarnyy
Это может выглядеть оправданным, когда нет своей инфры. Типа сидишь ты такой аналист в финансовом департаменте, прошёл курсы по пуспарку, решил лайтгбм наговнякать из своих цсв, а негде. Попросил в общеказеном опеншифте себе ресурсов и развлекаешься. Когда стоят свои сервера, зачем запускать датаноды через прослойку?
Из своих цсв ему не нужен пайспарк, просто KubeSpawner или вообще локальный Юпитер же
источник

N

Nikita Blagodarnyy in Data Engineers
Anton Zadorozhniy
Так а чем хадуп не устраивает?
Ну говорят старый он, пора на свалку.
источник

N

Nikita Blagodarnyy in Data Engineers
Anton Zadorozhniy
Из своих цсв ему не нужен пайспарк, просто KubeSpawner или вообще локальный Юпитер же
А если нужен какой-то фреймворк распределенных вычислений?
источник

AZ

Anton Zadorozhniy in Data Engineers
Nikita Blagodarnyy
А если нужен какой-то фреймворк распределенных вычислений?
Большие цсв очень
источник

AZ

Anton Zadorozhniy in Data Engineers
Nikita Blagodarnyy
Ну говорят старый он, пора на свалку.
Я по существу спрашивал, мб конкретные претензии какие есть
источник

AZ

Anton Zadorozhniy in Data Engineers
Из старого помню проблемы с утилизацией, но вроде в 3.2 уже оппортунистические контейнеры мажутся на хлеб, не уверен что есть можно
источник

AZ

Anton Zadorozhniy in Data Engineers
Вроде уже близко, смотрю на YARN-1011, знатный долгострой конечно
источник

GP

Grigory Pomadchin in Data Engineers
Anton Zadorozhniy
Так а чем хадуп не устраивает?
навреное тут правильнее сказать ярн
источник

GP

Grigory Pomadchin in Data Engineers
меня с ярном не устраивает, что что контейнеры в которых спарк ранится они не тру контейнеры, тянут зависиомсти с хост машины
источник

GP

Grigory Pomadchin in Data Engineers
очень неудобно когда хочется и вресию спарка собрать свою и зависимостей напихать нативных для твоей джобы
источник

GP

Grigory Pomadchin in Data Engineers
ну и ярн используется обычно только для большедатожоб
кто тут в чате пускает обычные приложения в ярнах?
источник

GP

Grigory Pomadchin in Data Engineers
наверное кто-то пускает и так делать можно (теоретически)
я бы не стал
источник

N

Nikita Blagodarnyy in Data Engineers
Grigory Pomadchin
меня с ярном не устраивает, что что контейнеры в которых спарк ранится они не тру контейнеры, тянут зависиомсти с хост машины
Падажжите, в 3 ходупе вроде можно уже докеры шедулить, не только ярны. Или я ошибаюсь?
источник

GP

Grigory Pomadchin in Data Engineers
Nikita Blagodarnyy
Падажжите, в 3 ходупе вроде можно уже докеры шедулить, не только ярны. Или я ошибаюсь?
конечно можно
источник

GP

Grigory Pomadchin in Data Engineers
можно и без докеров было
источник

N

Nikita Blagodarnyy in Data Engineers
Решает ли это проблему нетрушности контейнеров?
источник

GP

Grigory Pomadchin in Data Engineers
спарки на ярне 3 работают как и на ярне 2 афаик
не знаю можно ли заставить спарки в докер контейнерах под ярном работать

но наверн както можно - у ярна там сеттингов милиард
источник

N

Nikita Blagodarnyy in Data Engineers
Anton Zadorozhniy
Я по существу спрашивал, мб конкретные претензии какие есть
Да нет, это скорее попытка осознать идеи коллег.
источник

GP

Grigory Pomadchin in Data Engineers
Nikita Blagodarnyy
Да нет, это скорее попытка осознать идеи коллег.
да гемор) я больше людей знаю кто мезос использовал как менеджер ресурсов / скедулер чем кто использовал ярн (не для большедат)
источник