Size: a a a

2021 November 26

R

R in Moscow Spark
Встроенные сиквельные функции могут работать непосредственно с байтовым представлением Row объекта в отличие от udf
источник

ИК

Иван Калининский... in Moscow Spark
можно надеяться на лучшее, ну или посмотреть, если так сильно интересует))
источник

ИК

Иван Калининский... in Moscow Spark
тем более, я всё ещё сижу на 2.4, а все уже на 3.2
источник

SI

Sergey Ivanychev in Moscow Spark
Привет! Делюсь своей статьей про то, как писать код на Scala/Spark и затем использовать его из PySpark

https://medium.com/@sergeyivanychev/building-data-platform-in-pyspark-part-1-python-and-scala-interop-c52f96b7dc59

Пока оставлю ссылку на драфт, потому что HR партнер слишком рано опубликовал, по ее словам
источник

DZ

Dmitry Zuev in Moscow Spark
в чем ценность/новизна?
источник

SI

Sergey Ivanychev in Moscow Spark
У меня заняло ненулевое время понять, как такое делать — делюсь с остальными
источник

DZ

Dmitry Zuev in Moscow Spark
почему там sbt, но почему то build.gradle
источник

DZ

Dmitry Zuev in Moscow Spark
при чем там deequ?
источник

SI

Sergey Ivanychev in Moscow Spark
да, поправил опечатку, спасибо!
источник

SI

Sergey Ivanychev in Moscow Spark
просто пример хорошей библиотеки, которая в питоне не настолько хороша
источник

DZ

Dmitry Zuev in Moscow Spark
примерно 100% библиотек не так хороши в питоне как на жвм.
Про дельту ваще не понял
источник

DZ

Dmitry Zuev in Moscow Spark
имхо в статье 80% воды.
Остальные 15 это копия доки
источник

SI

Sergey Ivanychev in Moscow Spark
спасибо за фидбек
источник

KR

Kagermanov Ramazan in Moscow Spark
Реально
Тут скорее надо думать о том, есть ли что-то на питоне лучше, чем на скале, а не наоборот
источник

DZ

Dmitry Zuev in Moscow Spark
не написано про java udf
источник

DZ

Dmitry Zuev in Moscow Spark
который можно из питона вызвать
источник

DZ

Dmitry Zuev in Moscow Spark
Sometimes PySpark partitioning API is not enough for you

ну да, зашить это в джава код это логично. Чтобы потом саппортить и питон и джаву
источник

A

Alex in Moscow Spark
Сразу же в глаза бросилось

"org.apache.spark" % "spark-core_2.12" % sparkVersion % "provided",

Зачем скала версию выдавать есть у вас сбт?
источник

SI

Sergey Ivanychev in Moscow Spark
ты имеешь в виду зарегистрировать ее в Java коде и позвать из питона?
источник

DZ

Dmitry Zuev in Moscow Spark
"org.apache.spark" % "spark-core_2.12" % sparkVersion % "provided" -> "org.apache.spark" % "spark-core" %% sparkVersion % "provided",
источник