Size: a a a

2019 June 27

O

Oleg in Data Engineers
Андрей Жуков
Там вроде вебинар скоро,  можешь в лоб спросить
Дадите ссыль?
источник

АЖ

Андрей Жуков in Data Engineers
Oleg
Дадите ссыль?
оказывается, уже был 🙁
но можно запись глянуть https://go.pardot.com/e/593381/oadmap-EMEA-Webinar-2019-06-25/25hvw18/740854455
источник

OP

O. Petr in Data Engineers
А что делать если /tmp/blockmgr-* засоряется спарком ?
источник

ЕГ

Евгений Глотов in Data Engineers
Чистить руками, делать так, чтобы ваши джобы не падали
источник

ЕГ

Евгений Глотов in Data Engineers
Вернее не джобы, а сессии
источник

ЕГ

Евгений Глотов in Data Engineers
Если вырубить сессию посередине выполнения джоба, она оставит такой вот мусор
источник

OP

O. Petr in Data Engineers
А, это только при падении, спасибо)
источник

OP

O. Petr in Data Engineers
А персисты не оставляют после себя ничего ?
источник

OP

O. Petr in Data Engineers
Только если опять таки упадет жоба?
источник

ЕГ

Евгений Глотов in Data Engineers
А спарк в локальном режиме?
источник

OP

O. Petr in Data Engineers
пока да
источник

ЕГ

Евгений Глотов in Data Engineers
Не, персист по идее должен дропаться
источник

ЕГ

Евгений Глотов in Data Engineers
А хотя стоп, если выключать много джобов посередине, то тоже остаётся мусор
источник

ЕГ

Евгений Глотов in Data Engineers
Или если джоб упал просто
источник

ЕГ

Евгений Глотов in Data Engineers
Не удаляется
источник

ЕГ

Евгений Глотов in Data Engineers
И на нодах, где экзекуторы, темп можно так неплохо забить, если сессия годами будет висеть
источник

ЕГ

Евгений Глотов in Data Engineers
Но при закрытии сессии этот темп будет удаляться
источник

ЕГ

Евгений Глотов in Data Engineers
Который в <...>/yarn/usercache
источник

ЕГ

Евгений Глотов in Data Engineers
Но в локальном именно падение сессии вызывает накопление мусора
источник

AB

Andrei Boaghe in Data Engineers
Всем привет
Не подскажите как понять какую именно версию spark используют депенденси от cloudera?

Например:
     <groupId>org.apache.spark</groupId>
     <artifactId>spark-core_2.11</artifactId>
     <version>2.2.0.cloudera1</version>
Какую версию спарка имеет эта депенденси под капотом ? Т.е. я хочу понять чем отличается "оригинальные" версии спарка (например 1.6.0) от версии cloudera ?
источник