Телеграмм чат группы hadoopusers страница 3750

14:44пожаловаться #1

И то правда. Не следил я, отдают эти железки сейчас обьектный интерфейс

Встреча руcскоязычных админов Hadoop

14:44пожаловаться #2

Oleg Ivchenko in Data Engineers

Переслано от Oleg Ivchenko

Всем привет!

Приглашаем поучаствовать в русскоязычном MeetUp администраторов экосистемы Hadoop, который пройдет 2 июля 2021г. с 18 до 23 часов.
Организаторы: лаборатория инноватики МФТИ и МТС.

В программе четыре докладчика из МФТИ, МТС, Yandex и Swisscom. Они расскажут как у них живёт Hadoop, какие проблемы возникают при администрировании и как решаются.
С учетом того что Cloudera стала платной, будет особенно интересно послушать про продукт Yandex.Dataproc (это Hadoop от Яндекс.Облака) и про опыт переезда инфраструктуры с Hadoop на Kubernetes.

Приглашаются все желающие! Подробности см. на сайте https://hadoop-admins.ru .

hadoop-admins.ru

Hadoop meetUp

14:49пожаловаться #3

Vitaly Pismarev in Data Engineers

У меня пишет The specified coupon "DB_CE" is not valid

15:02пожаловаться #4

Grigory Pomadchin in Data Engineers

снял с пина) видимо уже не валиден

15:03пожаловаться #5

Grigory Pomadchin in Data Engineers

в треде пишут что истек срок действия

Паша Финкельштейн... in Data Engineers

15:03пожаловаться #6

ПФ

Переслано от Томак Ксения...

DE or DIE #7

Ребята, мы рады анонсировать митап #7 нашего сообщества DE or DIE!

Дата и время: 16 июня (среда) 18:00
Формат: Онлайн (трансляция на YouTube)

Регистрация по ссылке: https://deordie.timepad.ru/event/1669693/

Темы:
18:00-19:00. Handling late data. How to make the right choice? - Дарья Буланова
19:15-20:15. Ingestion and historization in the Data Lake? - Илья Тодор
20:15-20:45. After Show - организаторы DE or DIE и спикеры

(*): Несмотря на англоязычные названия доклады будут на русском языке.

Ждем вас в следующую среду. Ссылку на трансляцию опубликуем за час до мероприятия.

15:11пожаловаться #7

АM

Ребята, всем привет
У меня проблема со спарком, а точнее spark-submit
Я деплою джобу на локальный minikube кластер 8 гб памяти 4 ядра, но у меня возникает две проблемы
Первая, под с драйвером стартует и берет 1,4гб и 1 ядро, но драйвер не создает executors, а сам в одиночку начинает выполнять таски
Второе, после загрузки данных в облако спарк зависает и не выполняет следующие джобы (show() и другие)

15:29пожаловаться #8

АM

Даже когда через идею запускаю, драйвер просто не создает executor'ы

15:35пожаловаться #9

АM

Была у кого такая проблема?

15:35пожаловаться #10

Grigory Pomadchin in Data Engineers

Как пускаешь покаж спарк сабмит; у тя кубер как менеджер ресурсов?

15:37пожаловаться #11

АM

Да, кубер менеджер ресурсов

15:39пожаловаться #12

АM

Сейчас команду скину

15:39пожаловаться #13

АM

spark-submit --master k8s://127.0.0.1:63658 --deploy-mode cluster --name sparkapp --class com.milto.scala.SparkApplication --conf spark.executor.instances=1 --conf spark.kubernetes.container.image=alexm2000/spark:v1 local:///opt/spark/jars/spark-1.0.0.jar

15:41пожаловаться #14

Max Efremov in Data Engineers

Хм, а подскажите по спарку: есть джоба, которая раньше запускалась в ярне в клиентском режиме и работала хорошо. Сейчас пускаю её в кластерном режиме и у меня отваливаются экзекьюторы, т.к. их убивает ярн из-за выхода за лимиты памяти контейнера. Сама джоба простая: с помощью 10 экзекьюторов вычитать данные из MS SQL и положить на S3. Параметры памяти и ядер не менял, число партиций и прочее одинаковое.
Чем вообще так глобально может отличаться клиентский режим от кластерного в лучшую сторону по ресурсам?

Арсен Шакирзянов... in Data Engineers

16:18пожаловаться #15

АШ

кластерный режим от клиентского отличается тем, что драйвер запускается в ярне. Точно экзекьюторы отваливаются, а не драйвер? Может для драйвера указано бОльшее кол-во памяти, чем для экзекьюторов.

16:45пожаловаться #16

Max Efremov in Data Engineers

точно экзекьюторы, в UI смотрю, там куча умерших экзекьюторов и тасок на них. Драйвер в обоих случаях мелкий, 1.1 гига памяти написано.
Пока решил проблему увеличением памяти на экзекьюторах просто, с 4х до 8 гигов но любопытно, что это было

16:51пожаловаться #17

ну ваще т странно
ты при старте задаешь размер памяти, это хмх

17:06пожаловаться #18

контейнеры должны упать по ООМ

17:06пожаловаться #19

лучше - у тебя не загружен сабмит хост, можно использовать любую дохлую тачку