Size: a a a

2020 February 25

C

Combot in Data Engineers
Rachael Daniel has been banned! Reason: CAS ban.
источник

IS

Igor Sam in Data Engineers
Anton Shelin
А вот как это для бизнеса выглядит
Классная книга
источник
2020 February 26

Э

Эльмир in Data Engineers
Коллеги, здравствуйте. А кто нибудь может направить на материал или объяснить вкратце как натравить confluent на mssql?
источник

AZ

Anton Zadorozhniy in Data Engineers
Эльмир
Коллеги, здравствуйте. А кто нибудь может направить на материал или объяснить вкратце как натравить confluent на mssql?
что конкретно вы хотите сделать?
источник

Э

Эльмир in Data Engineers
@dartov Посылать изменения в таблицах из МССГЛ в конфлюент для последующего соединения потоков и таблиц и в итоге пересылания в условный Power BI. Поточную аналитику по сути. Я просто с самим инструментом только познакомился.
источник

AZ

Anton Zadorozhniy in Data Engineers
источник

BK

Brusе Kawabata in Data Engineers
Как проще всего запускать Спарк приложения на удаленном кластере ?
источник

BK

Brusе Kawabata in Data Engineers
Под управлением ярна
источник

AE

Alexey Evdokimov in Data Engineers
можно чё-нить типа livy там держать. вполне норм.
источник

AZ

Anton Zadorozhniy in Data Engineers
Alexey Evdokimov
можно чё-нить типа livy там держать. вполне норм.
плюсую, или сразу запускать приложение вместе с кластером
источник

K

KrivdaTheTriewe in Data Engineers
Brusе Kawabata
Как проще всего запускать Спарк приложения на удаленном кластере ?
Докером
источник

AE

Alexey Evdokimov in Data Engineers
вот ничоси "проще"
источник

R

Renarde in Data Engineers
Brusе Kawabata
Как проще всего запускать Спарк приложения на удаленном кластере ?
а spark-sumbit обычный чем плох?
источник

R

Renarde in Data Engineers
обычно делается пара-тройка edge-node внутри YARN кластера, с которых и улетают сабмиты
источник

R

Renarde in Data Engineers
Anton Zadorozhniy
плюсую, или сразу запускать приложение вместе с кластером
а ты уверен что это попадает в определение “проще”? 😃
источник

AP

Abi Palagashvili in Data Engineers
Коллеги, а может кто-то с pyspark-ом подсказать?
Собрал энв в zip-архив, запускаю spark2-submit с —deploy-mode cluster, указываю зипарь через -- archives
Указываю
--conf spark.yarn.appMasterEnv.PYSPARK_PYTHON=./envname.zip/bin/python
В логах получаю Cannot run program "./envname.zip/bin/python"
источник

AP

Abi Palagashvili in Data Engineers
Что не так я делаю?)
источник

AP

Abi Palagashvili in Data Engineers
надо ли зипарь с энвом на hdfs уносить куда-то?
источник

AZ

Anton Zadorozhniy in Data Engineers
Renarde
а ты уверен что это попадает в определение “проще”? 😃
aws emr create-cluster, ну и джоб чтобы лежал в бакете
источник

AE

Alexey Evdokimov in Data Engineers
если джоб строго один, то так проще всего конечно
источник