Size: a a a

2019 June 05

UD

Uncel Duk in Data Engineers
mel kaye
например на i/o, как не крути головка у диска всего одна
device-read-iops
источник

UD

Uncel Duk in Data Engineers
в докер ран
источник

m

mel kaye in Data Engineers
Uncel Duk
device-read-iops
хмммм, спасибо
источник
2019 June 06

m

mel kaye in Data Engineers
раз уж тут так тихо - спрошу. разве размер блока в 128 мб в хадупе как то влияет на расположение данных на диске? разве ос не разобет этот блок на более мелкие изза своих нужд?
источник

A

Alex in Data Engineers
Дата локалити когда будешь раскидывать задачи между нодами
источник

A

Alex in Data Engineers
Поэтому паркет блок 1гб пытается ставить
источник

m

mel kaye in Data Engineers
Alex
Дата локалити когда будешь раскидывать задачи между нодами
А при чем тут она?
источник

m

mel kaye in Data Engineers
Вроде такой блоксайз сделан чтоб минимизировать долю seek при чтении
источник

A

Alex in Data Engineers
Не только
источник

UD

Uncel Duk in Data Engineers
mel kaye
раз уж тут так тихо - спрошу. разве размер блока в 128 мб в хадупе как то влияет на расположение данных на диске? разве ос не разобет этот блок на более мелкие изза своих нужд?
Побьет конечно ( если вопрос про как оно лежит шпинделях )
источник

m

mel kaye in Data Engineers
Uncel Duk
Побьет конечно ( если вопрос про как оно лежит шпинделях )
Тогда зачем в hadoop defenitive guide аргументируют блоксайз этим?
источник

UD

Uncel Duk in Data Engineers
Побив файл на чанки, его можно читать паралельно, толще файл, меньше сиков, меньше оперативки жрется на метадату
источник

GG

George Gaál in Data Engineers
mel kaye
раз уж тут так тихо - спрошу. разве размер блока в 128 мб в хадупе как то влияет на расположение данных на диске? разве ос не разобет этот блок на более мелкие изза своих нужд?
Обычно ос не бьёт файлы на мелкие куски, если есть возможность писать одним блоком
источник

m

mel kaye in Data Engineers
но гарантий выходит нет, верно?
источник

GG

George Gaál in Data Engineers
mel kaye
но гарантий выходит нет, верно?
Нет, но тебя это и не должно особо волновать. Там же много магии. Тот же файловый кэш в озу
источник
2019 June 07

AZ

Anton Zadorozhniy in Data Engineers
источник

S

Stanislav in Data Engineers
пивотал то за что
источник

AZ

Anton Zadorozhniy in Data Engineers
денег мало зарабатывают
источник

OA

Oleksandr Averchenko in Data Engineers
Просто облака сьели рынок мелкого и среднего бизнеса.
источник

OA

Oleksandr Averchenko in Data Engineers
Крупный бизнес пилит свои велосипеды.
источник