Size: a a a

2019 October 07

A

Alex in Data Engineers
источник

SB

Sergey Bakaleynik in Data Engineers
Alex
снести spark_local_ip и запустить с --master yarn --deploy-mode cluster
ща вот это пытаюсь
источник

A

Alex in Data Engineers
Sergey Bakaleynik
ну кластер в одной сети
неймнода на 10.90.138.32 (кластер думаю тоже в какой-то той подсети)
ваш айпи что вы ставите 10.91.51.13

2 разные подсети
то что вы видите все машинки хадупа
не значит что они видят вас =)

nat и firewall придумали уже давно, стандартная практика когда хадуп кластер в офисную сеть доступа не имеет
источник

E

Evgeny in Data Engineers
Alex
неймнода на 10.90.138.32 (кластер думаю тоже в какой-то той подсети)
ваш айпи что вы ставите 10.91.51.13

2 разные подсети
то что вы видите все машинки хадупа
не значит что они видят вас =)

nat и firewall придумали уже давно, стандартная практика когда хадуп кластер в офисную сеть доступа не имеет
А если сетка /8 ?
источник

A

Alex in Data Engineers
Не верю %)
источник

ЕГ

Евгений Глотов in Data Engineers
Evgeny
А если сетка /8 ?
Когда не хватило коров для спарка, и закупили реально большой кластер)
источник

E

Evgeny in Data Engineers
Евгений Глотов
Когда не хватило коров для спарка, и закупили реально большой кластер)
Или хорошо умеют в виртуалки ;)
источник

N

Nikita Blagodarnyy in Data Engineers
А кто-нибудь эксплуатирует Ignite? Какие впечатления?
источник

N

Nikita Blagodarnyy in Data Engineers
Насколько он стабилен/production ready?
источник
2019 October 08

ПФ

Паша Финкельштейн in Data Engineers
Nikita Blagodarnyy
Насколько он стабилен/production ready?
Под какие задачи? Под какие-то я использовал
источник

ПФ

Паша Финкельштейн in Data Engineers
Насчёт продакшн-реди — ну сбер признал эксперимент неудачным
источник

N

Nikita Blagodarnyy in Data Engineers
Паша Финкельштейн
Под какие задачи? Под какие-то я использовал
Организация быстрого кэша под горячие свежие данные.
источник

ПФ

Паша Финкельштейн in Data Engineers
А объём и модель использования?
источник

ПФ

Паша Финкельштейн in Data Engineers
У мен ятам были гигабайты и мн ебыли не страшны потери, мн ебыло ок
источник

N

Nikita Blagodarnyy in Data Engineers
Идут запросы из грида с сайта, около 1000-1100 активных сессий
источник

ПФ

Паша Финкельштейн in Data Engineers
Но при этом я не пытался заигрывать с тамошним SQL, например
источник

N

Nikita Blagodarnyy in Data Engineers
Данных миллиарда 3 строк на ~120 Гб
источник

ПФ

Паша Финкельштейн in Data Engineers
Nikita Blagodarnyy
Идут запросы из грида с сайта, около 1000-1100 активных сессий
так активно у меня не было и не увреен что прям идеально для игнита. Не смотрели аэроспайк?
источник

N

Nikita Blagodarnyy in Data Engineers
Пока ничего ещё не смотрел, размышляю над архитектурой.
В КХ такой поток, наверное, не пережевать будет.
источник

GP

Grigory Pomadchin in Data Engineers
Nikita Blagodarnyy
Насколько он стабилен/production ready?
он достаточно старый, опенсорса только 5 лет у него;
источник