Size: a a a

2019 May 28

A

Alex in Data Engineers
Стучали точно на порт с webhdfs
источник

VS

Vitaliy Shevchenko in Data Engineers
Alex
Стучали точно на порт с webhdfs
Да 8020 у нейм ноды
источник

A

Alex in Data Engineers
Так это же бинарный порт неймноды
источник

A

Alex in Data Engineers
Вебхдфс по умолчанию на другом висит, посмотрите в настройках сервиса
источник

PA

Polina Azarova in Data Engineers
50070 для webhdfs или 14000 для httpfs
источник

VS

Vitaliy Shevchenko in Data Engineers
Alex
Вебхдфс по умолчанию на другом висит, посмотрите в настройках сервиса
Огромное спасибо. 50070 по дефолту порт у меня. Через него все работает !
источник

VS

Vitaliy Shevchenko in Data Engineers
Polina Azarova
50070 для webhdfs или 14000 для httpfs
Спасибо !
источник
2019 May 29

神風 in Data Engineers
Всем привет. Сталкивались с такой проблемой? Hbase 1.2 cdh 5.13 java client из ide создаёт табличку и пишет почти без проблем. Есть замечания по скорости установления соединения с зукипером. Запускаю в ярне - таски валятся Can't get the location for replica 0 . Не подскажете куда копать?
источник

EN

Eldar Nezametdinov in Data Engineers
神風
Всем привет. Сталкивались с такой проблемой? Hbase 1.2 cdh 5.13 java client из ide создаёт табличку и пишет почти без проблем. Есть замечания по скорости установления соединения с зукипером. Запускаю в ярне - таски валятся Can't get the location for replica 0 . Не подскажете куда копать?
Место на кластере есть?
источник

神風 in Data Engineers
Eldar Nezametdinov
Место на кластере есть?
Навалом
источник

IK

Ilya Karpov in Data Engineers
神風
Всем привет. Сталкивались с такой проблемой? Hbase 1.2 cdh 5.13 java client из ide создаёт табличку и пишет почти без проблем. Есть замечания по скорости установления соединения с зукипером. Запускаю в ярне - таски валятся Can't get the location for replica 0 . Не подскажете куда копать?
Проверял что к правильному зукиперу ходит?
источник

IK

Ilya Karpov in Data Engineers
Ребзя кто-нить пробовал настраивать Node Label в Capacity Scheduler в CDH5? Проблема в том что не смотря на выставленую пропертю метки в hdfs не персистятся и после ребута RM они испаряются.
источник
2019 May 30

OP

O. Petr in Data Engineers
Реально мониторить размер датафрейма спарка в памяти ? (Размер персиста, и желательно скок максимум хипа будет выделено во время расчета дф )
источник

OP

O. Petr in Data Engineers
Нашел что то вроде размера самих объектов в дф
spark.sessionState.executePlan(df.queryExecution.logical).optimizedPlan.stats.sizeInBytes
И
org.apache.spark.util.SizeEstimator для оценки объектов, по идее можно засунуть и дф, но что возвращает не совсем понятно, df с 0 длиной 41 мб.
источник

R

Renarde in Data Engineers
Всем привет. Вопрос такой - у кого есть долгоиграющие spark streaming приложения в продакшене - не встречали ли вы ошибок, связанных с OOM?
Суть ошибки - есть работающая streaming-задача. С ней все нормально, но приблизительно через 12-13 часов после старта все экзекьюторы по очереди умирают от OOM ошибок. Какие настройки можно покачать чтобы избавиться от этой проблемы?
источник

РА

Рамиль Ахмадеев in Data Engineers
привет!
источник

РА

Рамиль Ахмадеев in Data Engineers
тут есть два варика, либо течет сам спарк, либо твой код, либо есть пики нагрузки, тогда просто памяти докинуть
источник

РА

Рамиль Ахмадеев in Data Engineers
но ты ведь наверное последние две вещи проверил
источник

РА

Рамиль Ахмадеев in Data Engineers
🙂
источник

РА

Рамиль Ахмадеев in Data Engineers
а не пробовал хип дампы и тред дампы смотреть?
источник