Size: a a a

2021 January 26

MB

Maksim Batsiuk in Data Engineers
но со временем может и 50 и 100 стать
источник

MB

Maksim Batsiuk in Data Engineers
целесообразно для каждого файла создавать отдельный поток?
источник

AZ

Anton Zadorozhniy in Data Engineers
Maksim Batsiuk
и вторая проблема, что мне нужно писать не в один файл, а в несколько, я даже не знаю со временем на сколько это количество может возрасти, там просто идёт парсинг входящего файла и по одному из полей создаётся каталог
Я не уверен что понимаю вашу проблему, писать разные файлы из одного приложения это вроде тривиальная задача
источник

MB

Maksim Batsiuk in Data Engineers
Anton Zadorozhniy
Я не уверен что понимаю вашу проблему, писать разные файлы из одного приложения это вроде тривиальная задача
тогда буду на практике пробовать, спасибо за советы, были полезные
источник

AZ

Anton Zadorozhniy in Data Engineers
Maksim Batsiuk
целесообразно для каждого файла создавать отдельный поток?
Это зависит от вашего стека и потока
источник
2021 January 27

AZ

Anton Zadorozhniy in Data Engineers
Maksim Batsiuk
тогда буду на практике пробовать, спасибо за советы, были полезные
Посмотрите как работает этот коннектор, какие параметры конфигурации позволяет задавать, мб послужит вдохновением для вас
источник

AZ

Anton Zadorozhniy in Data Engineers
источник

MB

Maksim Batsiuk in Data Engineers
спасибо, обязательно гляну
источник

AA

Ali Abdullaev in Data Engineers
Ребята, никто не сталкивался с ошибками "Executor is not registered" при shuffle в spark?
источник

D

Dikesh Shah in Data Engineers
/stat@combot
источник

C

Combot in Data Engineers
Total messages: 74994
источник

e

er@essbase.ru in Data Engineers
Народ, подскажите , в логах в каких единицах отражается память ? в mb ?

2021-01-27 09:29:26,049 INFO [RMCommunicator Allocator] org.apache.hadoop.mapreduce.v2.app.rm.RMContainerAllocator: Recalculating schedule, headroom=<memory:179200, vCores:13>
источник

A

Alex in Data Engineers
да
источник

A

Alex in Data Engineers
all YARN configurations have specified memory in MB
источник

AZ

Anton Zadorozhniy in Data Engineers
источник

AV

Alexandr Vladimirovi... in Data Engineers
Привет, подскажите плиз, у confluent есть Kafka connect sink JDBC
эта штука open source или требуется подписку на confluent platform и используется исключительно в этом коробочном решении?
источник

AV

Alexandr Vladimirovi... in Data Engineers
и для того чтобы условно подружить Debezium to Kafka с синком  в JDBC хранилище, это надо либо писать свой коннектор в Kafka connect фреймворке или брать свою kafka либку и в качестве consumer данные записывать?
источник

AZ

Anton Zadorozhniy in Data Engineers
Alexandr Vladimirovich
Привет, подскажите плиз, у confluent есть Kafka connect sink JDBC
эта штука open source или требуется подписку на confluent platform и используется исключительно в этом коробочном решении?
этот коннектор использует confluent community license, вы можете использовать его для определенных вещей, но строить сервисы которые конкурируют с Confluent нельзя https://github.com/confluentinc/kafka-connect-jdbc
источник

AZ

Anton Zadorozhniy in Data Engineers
источник

AV

Alexandr Vladimirovi... in Data Engineers
Anton Zadorozhniy
этот коннектор использует confluent community license, вы можете использовать его для определенных вещей, но строить сервисы которые конкурируют с Confluent нельзя https://github.com/confluentinc/kafka-connect-jdbc
получается что я могу установить Apache версию kafka, сверху поставить kafka connect и скачать этот коннектор?
источник