Size: a a a

2021 November 29

АА

Артем Анистратов... in Moscow Spark
Всем привет! Могли бы подсказать, есть ли какой либо профит в том, что создается спарк сессия для каждой отдельной задачи(чтение оракла, хдфс, запись результата)?
На первый взгляд кажется, что только утяжеляет алгоритм.
источник

АА

Артем Анистратов... in Moscow Spark
Уточню, сессии не используются параллельно, просто последовательно открываются и закрываются после выполнения своей части алгоритма
источник

DZ

Dmitry Zuev in Moscow Spark
это какой то бред
источник

ИК

Иван Калининский... in Moscow Spark
Не вижу здесь профита, только оверхед и отсутствие возможности переиспользования наборов данных
источник

DZ

Dmitry Zuev in Moscow Spark
как можно чтение и запись в разных сессиях сделать то?
источник

АА

Артем Анистратов... in Moscow Spark
Может не верно выразился, создается спарк сессия, в ней читают данные из оракла парсят в rdd, запихивают в словарь, закрывают сессию. Аналогично для хдфс, затем "ворочают" словари, для записи результата в оракл делают новую спарк сессию, пишут результат, закрывают сессию
источник

АА

Артем Анистратов... in Moscow Spark
Да я вот тоже так думаю, но предположил что чего то не знаю
источник

DZ

Dmitry Zuev in Moscow Spark
что такое словарь?
источник

АА

Артем Анистратов... in Moscow Spark
dict python
источник

DZ

Dmitry Zuev in Moscow Spark
уу бля
источник

DZ

Dmitry Zuev in Moscow Spark
источник

ИК

Иван Калининский... in Moscow Spark
Обычно стараются наоборот, мультиплексировать джобы в одной и той же сессии. Появляется вопрос, как её лучше настроить
источник

DZ

Dmitry Zuev in Moscow Spark
проблема не в сессиях, проблема в том что вы спарк не по назначению используете
источник

АА

Артем Анистратов... in Moscow Spark
Это я полностью осознаю. Тут была попытка понять: я не знаю что то, или код, на который я смотрю, странный
источник

АР

Андрей Романов... in Moscow Spark
может, словарь получится заменить на джойн датафреймов из оракла и hdfs?

или же наоборот, словарь заменил эти джойны?
источник

k

kvadratura in Moscow Spark
🤣🤣
источник

k

kvadratura in Moscow Spark
обычно спарковский код = все "ворочается в датафреймах", без конвертации во всякие пандасы или путонские / скаловские data structures
источник

АА

Артем Анистратов... in Moscow Spark
Тык даа, но почему то люди сделали иначе. Я и подумал или тут сверх умное решение: я еще не преисполнился в своем сознании, что бы понять его или просто глупость написана
источник

k

kvadratura in Moscow Spark
это все еще и в юпутер-тетрадке, наверное?
источник

k

kvadratura in Moscow Spark
разве что, там какой-то сверх хитрый типа-джоин, который невозможно реализовать в спарке (сильно сомневаюсь)
источник