Size: a a a

2019 October 11

DZ

Dmitry Zuev in Moscow Spark
Так драйвер порвет
источник

☭S

☭ ⤳ λ Shinkevich... in Moscow Spark
а иначе - только первый мой вариант. не передашь ты на экзекутор сессию, что бы сделать что-то типа df.flatMap(r=>  sql.read.format("org.elasticsearch.spark.sql")
                       .options(options)
                       .load("spark/index").filter(f=> r.что-то-там))
источник

DZ

Dmitry Zuev in Moscow Spark
☭ ⤳ λ Shinkevich
а иначе - только первый мой вариант. не передашь ты на экзекутор сессию, что бы сделать что-то типа df.flatMap(r=>  sql.read.format("org.elasticsearch.spark.sql")
                       .options(options)
                       .load("spark/index").filter(f=> r.что-то-там))
Это так не работает
источник

DZ

Dmitry Zuev in Moscow Spark
Потому что flatmap ненастоящий
источник

DZ

Dmitry Zuev in Moscow Spark
Ну да
источник

DZ

Dmitry Zuev in Moscow Spark
Увы
источник

☭S

☭ ⤳ λ Shinkevich... in Moscow Spark
если уж очень хочется с pushdown можно партицировать исходную df, по-партициям делать collect на драйвере, ну и т.д.
источник

DZ

Dmitry Zuev in Moscow Spark
Да через map partition сделаю
источник
2019 October 13

ТС

Тимофей Смирнов... in Moscow Spark
всем привет,
гоняю спарк джобу в кубере и часто вылезает ошибка
java.lang.OutOfMemoryError
 at java.lang.AbstractStringBuilder.hugeCapacity(AbstractStringBuilder.java:161)

я пытаюсь решить через сохранение и считывание, но начинает вылезать все чаще в неожиданных местах
Может кто сталкивался ? как решали ?
источник

DZ

Dmitry Zuev in Moscow Spark
Какие memorylimit?
источник

DZ

Dmitry Zuev in Moscow Spark
А хотя не
источник

DZ

Dmitry Zuev in Moscow Spark
Тогда бы убивало контейнер прост
источник

SS

Semyon Sinchenko in Moscow Spark
Тимофей Смирнов
всем привет,
гоняю спарк джобу в кубере и часто вылезает ошибка
java.lang.OutOfMemoryError
 at java.lang.AbstractStringBuilder.hugeCapacity(AbstractStringBuilder.java:161)

я пытаюсь решить через сохранение и считывание, но начинает вылезать все чаще в неожиданных местах
Может кто сталкивался ? как решали ?
А что там ещё в стэктрейсе?
источник

ТС

Тимофей Смирнов... in Moscow Spark
Semyon Sinchenko
А что там ещё в стэктрейсе?
источник

SS

Semyon Sinchenko in Moscow Spark
Вот так кажется, что просто надо запрос разбить на покороче. И персисты вставить между ними.
источник

SS

Semyon Sinchenko in Moscow Spark
Что там такого делается, что запрос взрывает стринг билдер? Очень много колонок и очень длинный итоговый запрос?
источник

ТС

Тимофей Смирнов... in Moscow Spark
мне казалось что запрос не очень большой, несколько фильтров, groupby, join и это 24 раза
источник

ТС

Тимофей Смирнов... in Moscow Spark
спасибо, а не лучше делать checkpoint ?
источник

ЕГ

Евгений Глотов... in Moscow Spark
А может какие-нибудь строки на пару гигов?
источник

SS

Semyon Sinchenko in Moscow Spark
Не знаю. Я обычно, если проблемы с запросом или каталист стэк оверфлоу или подобные перед джойнами делаю персисты и акшны. Это ещё и сами джойны ускоряет.
источник