Телеграмм чат группы hadoopusers страница 1330

Всем привет. Сталкивались с такой проблемой? Hbase 1.2 cdh 5.13 java client из ide создаёт табличку и пишет почти без проблем. Есть замечания по скорости установления соединения с зукипером. Запускаю в ярне - таски валятся Can't get the location for replica 0 . Не подскажете куда копать?

источник

07:53пожаловаться #8

EN

Eldar Nezametdinov in Data Engineers

神風

Всем привет. Сталкивались с такой проблемой? Hbase 1.2 cdh 5.13 java client из ide создаёт табличку и пишет почти без проблем. Есть замечания по скорости установления соединения с зукипером. Запускаю в ярне - таски валятся Can't get the location for replica 0 . Не подскажете куда копать?

Место на кластере есть?

источник

08:15пожаловаться #9

神

神風 in Data Engineers

Eldar Nezametdinov

Место на кластере есть?

Навалом

источник

08:15пожаловаться #10

IK

Ilya Karpov in Data Engineers

神風

Всем привет. Сталкивались с такой проблемой? Hbase 1.2 cdh 5.13 java client из ide создаёт табличку и пишет почти без проблем. Есть замечания по скорости установления соединения с зукипером. Запускаю в ярне - таски валятся Can't get the location for replica 0 . Не подскажете куда копать?

Проверял что к правильному зукиперу ходит?

источник

19:32пожаловаться #11

IK

Ilya Karpov in Data Engineers

Ребзя кто-нить пробовал настраивать Node Label в Capacity Scheduler в CDH5? Проблема в том что не смотря на выставленую пропертю метки в hdfs не персистятся и после ребута RM они испаряются.

источник

19:37пожаловаться #12

2019 May 30

OP

O. Petr in Data Engineers

Реально мониторить размер датафрейма спарка в памяти ? (Размер персиста, и желательно скок максимум хипа будет выделено во время расчета дф )

источник

07:30пожаловаться #13

OP

O. Petr in Data Engineers

Нашел что то вроде размера самих объектов в дф

spark.sessionState.executePlan(df.queryExecution.logical).optimizedPlan.stats.sizeInBytes
И

org.apache.spark.util.SizeEstimator для оценки объектов, по идее можно засунуть и дф, но что возвращает не совсем понятно, df с 0 длиной 41 мб.

источник

07:32пожаловаться #14

R

Renarde in Data Engineers

Всем привет. Вопрос такой - у кого есть долгоиграющие spark streaming приложения в продакшене - не встречали ли вы ошибок, связанных с OOM?
Суть ошибки - есть работающая streaming-задача. С ней все нормально, но приблизительно через 12-13 часов после старта все экзекьюторы по очереди умирают от OOM ошибок. Какие настройки можно покачать чтобы избавиться от этой проблемы?

источник

17:59пожаловаться #15

РА

Рамиль Ахмадеев in Data Engineers

привет!

источник

17:59пожаловаться #16

РА

Рамиль Ахмадеев in Data Engineers

тут есть два варика, либо течет сам спарк, либо твой код, либо есть пики нагрузки, тогда просто памяти докинуть

источник

18:00пожаловаться #17