Size: a a a

2019 July 09

N

Nata in Data Engineers
на физический диск? или на virtual уже?
источник

N

Nata in Data Engineers
стоп, на virtual поидее
источник

A

Alex in Data Engineers
Что значит виртуал и физический?

У вас перечислены volumes в датаноде, для каждой из них применяется правило
источник

AZ

Anton Zadorozhniy in Data Engineers
а вроде балансер сейчас умеет балансировать между дисками внутри одной ноды? а то раньше была такая проблема..
источник

AP

Alexander Piminov in Data Engineers
саша
Всем привет!  

Уже 16 июля пройдет вебинар #ODSC “Kubeflow, MLFlow and Beyond — Augmenting ML Delivery”
❓Когда? 16 июля, 1 pm – 2 pm EST.
Спикер: Степан Пушкарев, CTO of Provectus

✨ Регистрация: http://bit.ly/MLworkflowODSCWebinar

Степан расскажет, как спроектировать эффективный ML процесс, про применение в нём различных open source инструментов способствующих автоматизации и воспроизводимости.

🚀 Узнать больше: https://www.facebook.com/events/1183366371834820
На основе какого стека будет  референс? Непосредственно сравнение инструментария будет? Заголовок интересный, а описание скудное.
источник

A

Alex in Data Engineers
Да, в тройке вроде как пофиклиси, чтобы не только между нодами, но и в пределах ноды между волумами делал балансировку
источник

A

Alex in Data Engineers
Клоудера даже бекпортила вроде как в 5.х какой-то
источник

N

Nata in Data Engineers
Alex
Что значит виртуал и физический?

У вас перечислены volumes в датаноде, для каждой из них применяется правило
у меня raid собран
источник

N

Nata in Data Engineers
а с точки зрения dn диск один
источник

A

Alex in Data Engineers
Если в конфиге только один путь, то значит один :)
источник

S

Stanislav in Data Engineers
Alex
Да, в тройке вроде как пофиклиси, чтобы не только между нодами, но и в пределах ноды между волумами делал балансировку
так там два режима же. раунд робин и последовательная запись
источник

E

Evgeny in Data Engineers
Nata
у меня raid собран
Но зачем?
источник

A

Alex in Data Engineers
@barloc https://community.hortonworks.com/articles/87440/hdfs-balancer-balancing-data-between-disks-on-a-da.html

Там же и ссылки на тикеты, что-то в 2.7 что-то в 3.0
источник

с

саша in Data Engineers
Eldar Nezametdinov
там про питон? spark? tensor?
спецом открыл фейсбук и ссылку, стэк вообще не указан...
Будут использованы Kubeflow и Hydrosphere. Касательно MLFlow и Kubeflow нельзя сказать, что их можно сравнить. Они выполняют относительно разный функционал, и вместе дополняют друг друга.
источник

S

Stanislav in Data Engineers
Alex
@barloc https://community.hortonworks.com/articles/87440/hdfs-balancer-balancing-data-between-disks-on-a-da.html

Там же и ссылки на тикеты, что-то в 2.7 что-то в 3.0
спс
источник

AP

Alexander Piminov in Data Engineers
саша
Будут использованы Kubeflow и Hydrosphere. Касательно MLFlow и Kubeflow нельзя сказать, что их можно сравнить. Они выполняют относительно разный функционал, и вместе дополняют друг друга.
Ну так-то они все (MLFlow, Hydrosphere, Kubeflow) чем-то отличаются, поэтому интересно посмотреть, что спикер включил в референс и какие задачи делегировал. Ок, спасибо!
источник

AB

Andrei Boaghe in Data Engineers
Привет всем,
Может кто помочь с интеграцией Spark/Kafka
1. Надо загрузить DataFrame в Kafka (т.е передать messages). Мы не используем Spark Streaming. Работаем со SparSQL 2.1.0. Есть ли у кого-то пример как это сделать, потому что сейчас делаю так и не уверен что это хороший solution:
источник

AB

Andrei Boaghe in Data Engineers
источник

AC

Alexander Chermenin in Data Engineers
df.write
 .format("kafka")
 .option("kafka.bootstrap.servers", "host1:port1,host2:port2")
 .option("topic", "topic1")
 .save()
источник

AK

Akeel Kumar in Data Engineers
Hi All

I want to be Data Engineer

Can you guys guide me
What should i do?
источник