Size: a a a

2022 February 07

A

ANatoly in Moscow Spark
Не заметил первый вопросительный знак)
Да, поверх ярна работает
источник

AS

Andrey Smirnov in Moscow Spark
это на этапе построения модели или уже при inference?
источник

A

ANatoly in Moscow Spark
Инференс, когда метрика считается через BinaryClassificationEvaluator
источник

AS

Andrey Smirnov in Moscow Spark
ну так уменьшите размер датафрейма
источник

A

ANatoly in Moscow Spark
Ну если быть точнее, то это во время отбора фич. Но ошибка конкретно на подсчёте метрики
источник

A

ANatoly in Moscow Spark
Ещё вот такое сообщение удалось вычитать:
#
# There is insufficient memory for the Java Runtime Environment to continue.
# Native memory allocation (mmap) failed to map 262144 bytes for committing reserved memory.
источник

A

Alex in Moscow Spark
Увеличить directmemory
источник

A

ANatoly in Moscow Spark
directmemory это про что?
источник

DZ

Dmitry Zuev in Moscow Spark
Это то что не хип
источник

A

ANatoly in Moscow Spark
А через какой параметр можно его увеличить?
источник
2022 February 08

ДМ

Дмитрий Морозов... in Moscow Spark
Всем привет! Появилась задача посчитать длину минимального маршрута по графу, для этого использовал библиотеку networkx(dijkstra_path_length) + подружил это все со спарком (результат нужно получить в отдельном поле в таблице). Я попробовал сделать все через udf и у меня валится с ошибкой недостатка памяти на исполнителе. Исходные данные составляют 30к строк, сам граф 600к строк(успешно работало, когда граф был около 100к строк) , но для такого недостаточно 32ГБ на исполнителях(использовал 10 инстансов, по 6 ядер и 32 ГБ памяти). Я посмотрел так же другие функция работы с графом, которые дружат с pyspark, но они не дают должно результата.

Есть ли у кого то опыт работы с графом и pyspark? Или может можно другими инструментами лучше это реализовать?
источник

k

kvadratura in Moscow Spark
перепишите на scala 😁
источник

k

kvadratura in Moscow Spark
все, что не совсем тривиально, на пуспарке будет ломучее рано или поздно
источник

DZ

Dmitry Zuev in Moscow Spark
да не поможет
источник

DZ

Dmitry Zuev in Moscow Spark
там проблема в том что оно не рапределенно считатеся
источник

DZ

Dmitry Zuev in Moscow Spark
кинь снипет как networkx дружил
источник

k

kvadratura in Moscow Spark
☝согласен, что уход с пуспарка всех проблем не решает. просто уже находился по граблям с полигонами и не только 😬

буду следить за тредиком, тоже интересно, как шарящие решат
источник

DZ

Dmitry Zuev in Moscow Spark
источник

DZ

Dmitry Zuev in Moscow Spark
блин, вот помню у меня на экзамене в универе как раз попался дейкстра на мр
источник

DZ

Dmitry Zuev in Moscow Spark
но это было 100 лет назад
источник