Телеграмм чат группы hadoopusers страница 2089

сейчас нет, я только погружаюсь в тему запуска pipeline ов, которые пишут аналитики

обучение пока не распределенное, pipeline ы построены на sklearn моделях, логистическая регрессия и т.п.

сейчас у меня такая концепция, есть очередь на обучение, я ее разгребаю и запускаю mlflow проект, он запускается на мощной тачке и учит модель, все складывается в mlflow, откуда при успешном обучении модель уезжает под ноги задачи, которая может эту модель как udf функцию предоставить

хочется запускать все не друг за другом, а максимально утилизировать как одну тачку, так и кластер таких машин, если он у кого то есть

сейчас у меня есть только опыт и понимание работы с yarn и java, и не очень понятно, как используя какой то workflow engine ограничить питоновский скрипт по ресурсам

т.е. есть четкое понимание, что если на этой мощной тачке моделим учить друг за другом, то все будет ок, но задач на обучение будет много и с утилизацией в любом случае надо будет что то делать

Mesos как раз придуман,чтобы максимально утилизировать кластер.

источник

14:43пожаловаться #6

DZ

Dmitry Zuev in Data Engineers

Rinat Sharipov

мне пока не совсем понятно, как например используя oozie или airflow ограничить доступное кол-во ресурсов для python скрипта

Запускать через сабмит на кластере ж

источник

14:43пожаловаться #7

N

Nikita Blagodarnyy in Data Engineers

Rinat Sharipov

мне пока не совсем понятно, как например используя oozie или airflow ограничить доступное кол-во ресурсов для python скрипта

В airflow заявлен режим масштабирования kubernetes. А там уже можно ресурсами рулить.

источник

14:44пожаловаться #8

DZ

Dmitry Zuev in Data Engineers

Через кудоп

источник

14:45пожаловаться #9

RS

Rinat Sharipov in Data Engineers

Dmitry Zuev

Через кудоп

?

источник

14:45пожаловаться #10

N

Nikita Blagodarnyy in Data Engineers

Nikita Blagodarnyy

В airflow заявлен режим масштабирования kubernetes. А там уже можно ресурсами рулить.

Ну типа он воркер таски в кубах запиливает. Не знаю, насколько это вкусно, я тестил только локально и через сельдерей. Работает, но с болью и слезами.

источник

14:45пожаловаться #11

DZ

Dmitry Zuev in Data Engineers

Rinat Sharipov

?

Kuber pod operator

источник

14:45пожаловаться #12

AZ

Anton Zadorozhniy in Data Engineers

Nikita Blagodarnyy

Mesos как раз придуман,чтобы максимально утилизировать кластер.

Можно в кубере оператором сделать, следить за фактической утилизацией и скейлить, но задачу на уровне кластера не решает

источник

14:46пожаловаться #13

R

Renarde in Data Engineers

Rinat Sharipov

мне пока не совсем понятно, как например используя oozie или airflow ограничить доступное кол-во ресурсов для python скрипта

через kubernetesoperator в эйрфлоу.
вы пакуете ваш скрипт в k8s объект, устанавливаете ресурсные ограничения на уровне этого объекта, а эйрфлоу просто запускает его

источник

14:46пожаловаться #14

DZ

Dmitry Zuev in Data Engineers

Nikita Blagodarnyy

Ну типа он воркер таски в кубах запиливает. Не знаю, насколько это вкусно, я тестил только локально и через сельдерей. Работает, но с болью и слезами.

Эт шляпа, пусть воркер плодит поды с нужными ресурсами

источник

14:46пожаловаться #15

RS

Rinat Sharipov in Data Engineers

Renarde

через kubernetesoperator в эйрфлоу.
вы пакуете ваш скрипт в k8s объект, устанавливаете ресурсные ограничения на уровне этого объекта, а эйрфлоу просто запускает его

ага, с kubernetes - примерно понятно, что это сделать проще будет, надо почитать, но его у меня пока нет, а есть только yarn )

источник

14:46пожаловаться #16

DZ

Dmitry Zuev in Data Engineers

Ну напиши свой йарн апп оператор

источник

14:47пожаловаться #17

RS

Rinat Sharipov in Data Engineers

Dmitry Zuev

Ну напиши свой йарн апп оператор