Size: a a a

2020 February 18

SK

Sergej Khakhulin in Data Engineers
Alexander Gorokhov
Красава
там можно к sqlalchemy, и там даже есть pr для поддержки различных доп методов, но тебе наверное с Django ORM это не подойдет
источник

AG

Alexander Gorokhov in Data Engineers
Да у меня это чисто праздный интерес, рабочей задачи не стоит такой
источник

N

Nikolay in Data Engineers
Что за CommitProcessor в ЗК? Когда он используется ? За что отвечает ?
источник

AZ

Anton Zadorozhniy in Data Engineers
Nikolay
Что за CommitProcessor в ЗК? Когда он используется ? За что отвечает ?
источник

RS

Rinat Sharipov in Data Engineers
ребята, всем привет !

подскажите пожалуйста, есть ли у кого опыт построения инфраструктуры обучения ml моделей ?

есть ли какой то resource manager, который можно использовать для запуска питоновских pipeline ов ограничивая cpu/ ram

чтобы в него можно было напихать множество задач на обучение моделей, а он уже дальше сам следил за выделением им ресурсов и запуском

насколько для этих целей можно использовать например yarn
источник

DZ

Dmitry Zuev in Data Engineers
Airflow mlflow k8s
источник

RS

Rinat Sharipov in Data Engineers
Dmitry Zuev
Airflow mlflow k8s
я планирую использовать mlflow, но меня интересует именно отслеживание ресурсов, доступных для обучения, пока нет понимания, как это делать
источник

DZ

Dmitry Zuev in Data Engineers
K8s
источник

DZ

Dmitry Zuev in Data Engineers
Лимиты реквесты
источник

AZ

Anton Zadorozhniy in Data Engineers
Rinat Sharipov
ребята, всем привет !

подскажите пожалуйста, есть ли у кого опыт построения инфраструктуры обучения ml моделей ?

есть ли какой то resource manager, который можно использовать для запуска питоновских pipeline ов ограничивая cpu/ ram

чтобы в него можно было напихать множество задач на обучение моделей, а он уже дальше сам следил за выделением им ресурсов и запуском

насколько для этих целей можно использовать например yarn
кубер удобнее всего, особенно если на облаке, а так можно в любом менеджере, просто что-то будет работать криво, допилить придется
источник

RS

Rinat Sharipov in Data Engineers
понял, спасибо ! если еще у кого то есть опыт запуска обучения например на yarn, буду благодарен, если поделитесь
источник

AZ

Anton Zadorozhniy in Data Engineers
и остается проблема accounting vs utilization когда вы выдали ресурсы, а используются они или нет вы контролировать не можете, но это уже мелочи
источник

DZ

Dmitry Zuev in Data Engineers
Anton Zadorozhniy
и остается проблема accounting vs utilization когда вы выдали ресурсы, а используются они или нет вы контролировать не можете, но это уже мелочи
На честности
источник

RS

Rinat Sharipov in Data Engineers
k8s врят ли щас будет возможность поднять, понял, спасибо !
источник

AZ

Anton Zadorozhniy in Data Engineers
Dmitry Zuev
На честности
на деньгах! пользователь платит за аккаунтинг, а если не может использовать - сам себе злой буратино
источник

AZ

Anton Zadorozhniy in Data Engineers
Rinat Sharipov
k8s врят ли щас будет возможность поднять, понял, спасибо !
GKS, EKS, AKS?
источник

DZ

Dmitry Zuev in Data Engineers
А у вас что за обучение вообще? Распределенное?
источник

RS

Rinat Sharipov in Data Engineers
Dmitry Zuev
А у вас что за обучение вообще? Распределенное?
сейчас нет, я только погружаюсь в тему запуска pipeline ов, которые пишут аналитики

обучение пока не распределенное, pipeline ы построены на sklearn моделях, логистическая регрессия и т.п.

сейчас у меня такая концепция, есть очередь на обучение, я ее разгребаю и запускаю mlflow проект, он запускается на мощной тачке и учит модель, все складывается в mlflow, откуда при успешном обучении модель уезжает под ноги задачи, которая может эту модель как udf функцию предоставить

хочется запускать все не друг за другом, а максимально утилизировать как одну тачку, так и кластер таких машин, если он у кого то есть

сейчас у меня есть только опыт и понимание работы с yarn и java, и не очень понятно, как используя какой то workflow engine ограничить питоновский скрипт по ресурсам

т.е. есть четкое понимание, что если на этой мощной тачке моделим учить друг за другом, то все будет ок, но задач на обучение будет много и с утилизацией в любом случае надо будет что то делать
источник

UD

Uncel Duk in Data Engineers
Сигруппы везде
источник

UD

Uncel Duk in Data Engineers
Но проблему "учета" ресурсов они не решают
источник