Size: a a a

2022 January 24

SI

Sergey Ivanychev in Moscow Spark
Если searchTermGroupsExcluded это мапа из айдишника в коллекцию, то я бы сделал из неё датафрейм и решил бы вопрос джойном
источник

JF

Jane Frankenstein in Moscow Spark
спасибо, решила переписать на leftAnti потому как фильтром хоть и читаемо, но не работает
источник
2022 January 26

ИК

Иван Калининский... in Moscow Spark
Коллеги, подскажите, о чём говорят сотни исключений вот такого типа:

org.apache.spark.shuffle.FetchFailedException: Failure while fetching StreamChunkId{streamId=, chunkIndex=0}: java.nio.file.NoSuchFileException: {/path/to/yarn/usercache/to/file.index}

org.apache.spark.shuffle.MetadataFetchFailedException: Missing an output location for shuffle {id}

org.apache.spark.shuffle.FetchFailedException: Failed to connect to {node.address}

Spark 2.4.5
Запрос с приличным количеством оконных функций, размер датасета около 200 Гб (в паркете около 70Гб)
Кластер он прем, не облако) На других кластерах проблем нет
источник

N

Nikita Blagodarnyy in Moscow Spark
Failed to connect
побилась сеть? нода перегружена и не принимает подключения?
источник

GP

Grigory Pomadchin in Moscow Spark
я б на отсуствии места на диске подумал, или о том что что-то чистит его и убирает блоки на которые он ссылаться хочет
источник

GP

Grigory Pomadchin in Moscow Spark
т.е. или места не хватило записать их или они уже убиты

но может и конект да
источник

N

Nikita Blagodarnyy in Moscow Spark
за ними же вроде должен шафл трекер следить, чтобы они не помирали просто так?
источник

ИК

Иван Калининский... in Moscow Spark
Вроде не замечали таких проблем, ноды живы
источник

ИК

Иван Калининский... in Moscow Spark
вот и я про это думал, но обосновать не могу)
источник

GP

Grigory Pomadchin in Moscow Spark
да, это может быть тяжело потому что в момент умирания ноды она подчистит за собой
источник

GP

Grigory Pomadchin in Moscow Spark
и получится что место есть)
источник

ИК

Иван Калининский... in Moscow Spark
Как это можно локализовать? Есть какие-то настройки, ограничивающие соединения с нодой?
источник

N

Nikita Blagodarnyy in Moscow Spark
в графану смотри в моменты косяков. общая загрузка тачки, параметры хипа/гц в этот момент.
источник

GP

Grigory Pomadchin in Moscow Spark
яб поставил мониторинг на диски / память / оперативу какойнить ганглией
источник

GP

Grigory Pomadchin in Moscow Spark
и посмотрел бы что слуичлось в момент отвала
источник

N

Nikita Blagodarnyy in Moscow Spark
ну тут Failed to connect как бэ намекает
источник

ИК

Иван Калининский... in Moscow Spark
хехе, на этот кластер меня пока не пустили(
Буду смотреть в расшаренном экране

Никита, Григорий, спасибо!
источник

N

Nikita Blagodarnyy in Moscow Spark
почитай ещё сислог хоть мельком.
источник

N

Nikita Blagodarnyy in Moscow Spark
там может стопицот ошибок диска
источник

GP

Grigory Pomadchin in Moscow Spark
)) у меня были похожие ошибки когда нода по дискам отваливалась) много времени ушло отловить

но да что угодно может быть
источник