Size: a a a

2020 March 23

MB

Mikhail Butalin in Data Engineers
Alex
тогда что-то странное
missing block в части UNDER_REPLICATED или CORRUPTED?
corrupted
источник

MB

Mikhail Butalin in Data Engineers
вернул ноду и потом прокачивал еще полдня :(
источник

MB

Mikhail Butalin in Data Engineers
в общем буду еще экспериментировать, т.к. есть ощущение что я недопонимаю ситуацию
источник

A

Alex in Data Engineers
если corrupted то это очень странно
источник

A

Alex in Data Engineers
как уже говорил: такое бывало только на временных файлах в момент записи, но никак не на обычных

(у меня почти всегда 2+ дисков в ноде)
источник

MB

Mikhail Butalin in Data Engineers
Просто я что тут подумал...
источник

MB

Mikhail Butalin in Data Engineers
может просто взять и все диски в страйп засунуть и не париться...
источник

A

Alex in Data Engineers
выпадение одного выводит целиком датаноду из строя, вместо одной точки монтирования
источник

A

Alex in Data Engineers
плюс непонятно как балансировать нагрузку датаноде
источник

MB

Mikhail Butalin in Data Engineers
а что с балансировкой не так?
источник

MB

Mikhail Butalin in Data Engineers
в случае страйпа как раз, по моему, вопрос балансировки решается автоматом
источник

A

Alex in Data Engineers
вообще hdfs не хранит реплики на одной ноде, именно поэтому на кластере из 1-2 машин с RF=3 можно увидеть under-replicated blocks всегда

для EC тоже доп политики пришлось вводить, чтобы блоки из одного chunk не оказались на одной ноде

поэтому на вашем месте я бы лучше разобрался что за файлы пропали и при каких условиях
источник

MB

Mikhail Butalin in Data Engineers
условие одно - хардкорный останов одной ноды
источник

MB

Mikhail Butalin in Data Engineers
имитация "ой, я упала"
источник

AB

Alexander Batyrshin in Data Engineers
Alex
выпадение одного выводит целиком датаноду из строя, вместо одной точки монтирования
это настраивается
источник

M

Mi in Data Engineers
кстати, может кто-нибудь знает как симулировать обрыв сети в условиях EMR?
источник

A

Alex in Data Engineers
Alexander Batyrshin
это настраивается
можно узнать как это с точки зрения стороннего процесса настраивается когда часть блоков читается часть не читается?
источник

AB

Alexander Batyrshin in Data Engineers
вся точка монтирования пометиться как больная и не будет использоваться
источник

AB

Alexander Batyrshin in Data Engineers
настраивается считать ли сбой точки монтирование отказом всей датаноды или нет
источник

A

Alex in Data Engineers
@ox62ash выше было про то чтобы не использовать точки монтирования, а использовать страйп, я поэтому и написал что выпадение одного диска в этом случае весь страйп/датанода отвалится =)
источник