Size: a a a

2017 March 07

p

ptchol in Data Engineers
под хдфс те нада 5 нод
источник

p

ptchol in Data Engineers
под зк тож желательно отдельные
источник

GP

Grigory Pomadchin in Data Engineers
Vitaliy Okulov
можешь ссылкой поделиться?
чет не могу найти, помню находил; ods.ai тут только формочка
источник

p

ptchol in Data Engineers
а где гонять махаут это как бы пофигу, всё равно скорее всего придёшь к тому, что придётся сигруппами резать приложения
источник

GP

Grigory Pomadchin in Data Engineers
а почему именно 5?)
источник

GP

Grigory Pomadchin in Data Engineers
3 чтоб проверить / посмотерть как мажется хватит
источник

p

ptchol in Data Engineers
ну что б проверить и одной хватит
источник

p

ptchol in Data Engineers
а так те нейм ноды 2 штуки, журнал 3 штуки, зукиперы тоже бы отдельно посадить куда нить
источник

p

ptchol in Data Engineers
мы вобще в нашем микрокластере пришли к решению, когда manage сервисы всех решений крутятся на 2-3 выделенных нодах, а весь компьют\сторадж ровно размазан по остальным нодам.
источник

NK

ID:1373407 in Data Engineers
источник
2017 March 10

AA

Akceptor AkceptorUA [🇺🇦, IF] in Data Engineers
Нам надо сделать приложение, работающее с HDFS\Hive но нужно поддерживать несколько дистрибутивов (Hortonworks\Cloudera\IBM) и  стоит вопрос как избежать jar hell работая с либьами самого хадупа в кластере. Есть какие-то best practise? Посоветуйте
источник
2017 March 11

NK

ID:1373407 in Data Engineers
источник
2017 March 19

NK

ID:1373407 in Data Engineers
как же она быстро говорит в курсе по спарку
источник

NK

ID:1373407 in Data Engineers
еще очень обидело, что скриншоты не обновили под  актуальные данные
источник

SZ

Sergey Zolotov in Data Engineers
есть в монге коллекция на 100миллионов записей, если юзать агрегатор монги то это занимает вечность и сама база в это время в окололежачем состоянии. на сколько есть смысл юзать спарк чтобы сделать агрегации?
источник

λ

λoλdog in Data Engineers
Sergey Zolotov
есть в монге коллекция на 100миллионов записей, если юзать агрегатор монги то это занимает вечность и сама база в это время в окололежачем состоянии. на сколько есть смысл юзать спарк чтобы сделать агрегации?
Ты это в Спарк будешь загружать вечно)
источник

λ

λoλdog in Data Engineers
Но попробовать нужно
источник

GP

Grigory Pomadchin in Data Engineers
λoλdog
Ты это в Спарк будешь загружать вечно)
Можно как то паралeлизацию выгрузки сдeлать попробовать, можeт и норм будeт да
источник

GP

Grigory Pomadchin in Data Engineers
Монга упрeтся вочтонить и всe
источник

GP

Grigory Pomadchin in Data Engineers
источник