Size: a a a

2019 April 25

KS

Kostya Shchetkin in Moscow Spark
0_0 , ок попробую, спс
источник

ЕГ

Евгений Глотов... in Moscow Spark
Главное не 50 withColumn
источник

ЕГ

Евгений Глотов... in Moscow Spark
А то вот это реально долго
источник

ЕГ

Евгений Глотов... in Moscow Spark
Я бы порекомендовал выгрузить список категорий, во-первых пивоту его на вход подать, а во-вторых написать по нему мап, который генерирует список оконных функций над каждой колонкой
источник

KS

Kostya Shchetkin in Moscow Spark
источник

KS

Kostya Shchetkin in Moscow Spark
спасибо!
источник

AA

Anton Alekseev in Moscow Spark
Подскажите, пользовал кто spark job-server для целей сохранения контекста, или это не прод решение? Типа такого https://stackoverflow.com/questions/31647703/how-to-cache-data-in-apache-spark-that-can-be-used-by-other-spark-job
источник

DG

Denis Gabaydulin in Moscow Spark
Я не пользовался, но у нас примерно такое же свое. В смысле что, в одном контексте выполняются разные приложения. И да, можно таким образом делать глобалкеши.
источник

DG

Denis Gabaydulin in Moscow Spark
То есть у нас есть воркеры, которые поднимают контекст. Ходят к планировщику, который выдает задачи. Пока задачи есть, контекст жив.
источник

AA

Anton Alekseev in Moscow Spark
Denis Gabaydulin
Я не пользовался, но у нас примерно такое же свое. В смысле что, в одном контексте выполняются разные приложения. И да, можно таким образом делать глобалкеши.
А своё в опенсорсе или закрыто?
источник

GP

Grigory Pomadchin in Moscow Spark
плохо работает
источник

GP

Grigory Pomadchin in Moscow Spark
может для какихто юзкейсов работает; в моих было медленно и неудобно
источник

DG

Denis Gabaydulin in Moscow Spark
Anton Alekseev
А своё в опенсорсе или закрыто?
Закрыто.
источник

GP

Grigory Pomadchin in Moscow Spark
проще написать свою апиху, если уж так хочется что-то типа джоб сервера
источник

GP

Grigory Pomadchin in Moscow Spark
есть новее шляпа https://github.com/Hydrospheredata/mist
источник

GP

Grigory Pomadchin in Moscow Spark
может она лучше, @dos65 может даже коментить по вопросам
источник

AA

Anton Alekseev in Moscow Spark
Grigory Pomadchin
проще написать свою апиху, если уж так хочется что-то типа джоб сервера
Ну видимо придётся, тот что на гитхабе (https://github.com/spark-jobserver/spark-jobserver) выглядит монструозным.
источник

AA

Anton Alekseev in Moscow Spark
Ооо найс, почитаю, спасибо
источник

VC

Vadim ChelyshOv in Moscow Spark
Grigory Pomadchin
может она лучше, @dos65 может даже коментить по вопросам
ну она не особо про кеши. но кейс с удержанием контекста есть.
источник
2019 April 26

PK

Pavel Klemenkov in Moscow Spark
Новость со Spark Summit. Databricks анонсировал Koalas. Pandas-comaptible API, который транслируется в датафреймы. Хороший ход, чтобы перетаскивать на Spark все больше датасатанистов, но мы то с вами знаем, что не все так просто )) https://www.youtube.com/watch?v=Shzb15DZ9Qg
источник