Size: a a a

2019 June 07

A

Alex in Data Engineers
ну вот и ценник на них начинает расти не само адекватно
источник

AZ

Anton Zadorozhniy in Data Engineers
можно хдфс узлы без ярна поднимать
источник

A

Alex in Data Engineers
George Gaál
просто в случае с ХДФС ты переплачиваешь за компьют (цпу-рам)
и выигрываешь потом на локалити данных
источник

AZ

Anton Zadorozhniy in Data Engineers
для он-премис/бареметал хдфс нормально, если только осс
источник

GG

George Gaál in Data Engineers
Anton Zadorozhniy
можно хдфс узлы без ярна поднимать
теоретически, но все же будут одинаковые кубики использовать
источник

GG

George Gaál in Data Engineers
я ж не говорю, что хдфс днище и его нельзя вообще никогда юзать
источник

AZ

Anton Zadorozhniy in Data Engineers
можно использовать ярн на отдельных узлах
источник

AZ

Anton Zadorozhniy in Data Engineers
Alex
и выигрываешь потом на локалити данных
для пакетной аналитики локалити не сильно нужен
источник

GG

George Gaál in Data Engineers
если много денег на серваки и хочется локалького стораджа - ну, ок. Просто все равно парням захочется С3 для других задач. И чего делать?
источник

GG

George Gaál in Data Engineers
две хранилки?
источник

AZ

Anton Zadorozhniy in Data Engineers
если не обязательно осс - isilon, он умеет оба интерфейса сразу
источник

GG

George Gaál in Data Engineers
кстати, а откуда такое требование ОСС? Типа если ОСС, то сможете сами починить? Ну, так не факт, совершенно
источник

GG

George Gaál in Data Engineers
а если покупать с поддержкой...
источник

AZ

Anton Zadorozhniy in Data Engineers
кмк для он-премис самые сложные задачи это обеспечение доступности, а не то как сохранить и выдать эти данные
источник

A

Alex in Data Engineers
в тему хранимки и s3, когда для отдельных вещей понадобилось:

приехали делл, выдали коробку на Х петабайт
потом нам стало нужно больше
привезли вторую коробку, начали из первой во вторую переливать
источник

IK

Ilya Karpov in Data Engineers
George Gaál
ну, спарк можно поверх куба запускать
а еще флинк, а еще скалировать сервисы
источник

AZ

Anton Zadorozhniy in Data Engineers
это же надо две/три кластера, делать репликацию и перекидывать клиента, тут кстати с ceph все сильно проще
источник

A

Alex in Data Engineers
ну флинк тоже умеет в кубик
ну и скейлиться в кубике тоже можно
источник

AZ

Anton Zadorozhniy in Data Engineers
Alex
в тему хранимки и s3, когда для отдельных вещей понадобилось:

приехали делл, выдали коробку на Х петабайт
потом нам стало нужно больше
привезли вторую коробку, начали из первой во вторую переливать
это айсилон?
источник

A

Alex in Data Engineers
это Dell EMC
источник