Телеграмм чат группы hadoopusers страница 1980

мы гоняем. у флинка неплохая дока, там довольно много описано и про деплой, и про нюансы выбора конкретных компонент апи. а что конкретно интересует? могу рассказать, что у нас принято:
1) 1 флинк-кластер = 1 джоба
2) везде прописывать uid'ы операторов
3) использовать ттл на стейте - в 99% случаев он нужен
4) мониторинг через прометеус (но не рекомендую, если у вас уже есть какой-нибудь statsd или graphite)
5) деплой и авто-рестарты через самописный watchdog

источник

16:11пожаловаться #9

P

Pavel in Data Engineers

Egor Mateshuk

мы гоняем. у флинка неплохая дока, там довольно много описано и про деплой, и про нюансы выбора конкретных компонент апи. а что конкретно интересует? могу рассказать, что у нас принято:
1) 1 флинк-кластер = 1 джоба
2) везде прописывать uid'ы операторов
3) использовать ттл на стейте - в 99% случаев он нужен
4) мониторинг через прометеус (но не рекомендую, если у вас уже есть какой-нибудь statsd или graphite)
5) деплой и авто-рестарты через самописный watchdog

на кубе, судя по всему?

источник

16:16пожаловаться #10

EM

Egor Mateshuk in Data Engineers

с кубом сейчас тестируемся. вроде успешно, но на прод еще не выкатывали. пока на ярне

источник

16:17пожаловаться #11

P

Pavel in Data Engineers

1 флинк-кластер = 1 джоба

вот это мне показалось таким дичайшим оверхедом...

источник

16:19пожаловаться #12

P

Pavel in Data Engineers

когда джоба всегда 1, ну, прибывают по 1 джобе раз в полгода, то мб, мб....

источник

16:19пожаловаться #13

EM

Egor Mateshuk in Data Engineers

Pavel

1 флинк-кластер = 1 джоба

вот это мне показалось таким дичайшим оверхедом...

не, не в смысле 1 кластер кубера/ярна на 1 джобу) флинк, когда стартует, разворачивает поверх контейнеров, выделенных ярном/кубером, свой кластер для удобства управления, в котором может запустить несколько джоб. но по мне, такой подход неудобен как раз из-за того, что получается кластер поверх кластера, что усложняет работу.

источник

16:25пожаловаться #14

Н

Никита in Data Engineers

Привет, а как лучше грузить файлы на hdfs.
Вот человеку надо грузануть 15 ГБ csv со своей тачки? Я думаю через webhdfs это не самый лучший подход или стоит ему посоветовать поставить hadoop-client с конфигами?

источник

16:29пожаловаться #15

P

Pavel in Data Engineers

Egor Mateshuk

не, не в смысле 1 кластер кубера/ярна на 1 джобу) флинк, когда стартует, разворачивает поверх контейнеров, выделенных ярном/кубером, свой кластер для удобства управления, в котором может запустить несколько джоб. но по мне, такой подход неудобен как раз из-за того, что получается кластер поверх кластера, что усложняет работу.

да, я это понял, то , что 1 джоба крутится на кластере куба/ярна, в котором для одной единственной джобы поднято по одному джоб-менеджеру и таск-менеджеру. вот такая топология: 1 джоба - 1 кластер выглядит как-то слишком жирной. оосбенно если всё это крутится под кубом.

источник

16:29пожаловаться #16

EM

Egor Mateshuk in Data Engineers

лишние ресурсы уходят только на джоб-менеджеры (а это копейки). зато это окупается простотой управления

источник

16:39пожаловаться #17

EV

Eduard Vlasov in Data Engineers

Egor Mateshuk

мы гоняем. у флинка неплохая дока, там довольно много описано и про деплой, и про нюансы выбора конкретных компонент апи. а что конкретно интересует? могу рассказать, что у нас принято:
1) 1 флинк-кластер = 1 джоба
2) везде прописывать uid'ы операторов
3) использовать ттл на стейте - в 99% случаев он нужен
4) мониторинг через прометеус (но не рекомендую, если у вас уже есть какой-нибудь statsd или graphite)
5) деплой и авто-рестарты через самописный watchdog

круто, спасибо
у меня пока нет конкретных вопросов, готовлюсь запускать первый джоб в прод, гоняем на долгоживущем EMR, yarn, стейт буду бросать в s3, собираюсь сделать JM HA

источник

16:39пожаловаться #18

EV

Eduard Vlasov in Data Engineers

» использовать ттл на стейте
вот это не понял

источник

16:40пожаловаться #19

EM

Egor Mateshuk in Data Engineers

Eduard Vlasov

» использовать ттл на стейте
вот это не понял

допустим, считаем мы какие-то действия посетителя на сайте (допустим, пытаемся понять, не мошенник ли он) на протяжении некоторого времени. человек уходит, а накопленная по нему инфа остается в стейте флинка. чтобы постепенно освобождать память, есть TTL, по которому стейт можно чистить. у нас просто было пару случаев, когда народ забывал его воткнуть и стейт начинал медленно, но верно расти, сжирая память и усложняя чекпойнтинг

источник

16:45пожаловаться #20