Телеграмм чат группы moscowspark страница 825

Delta 1.0.0
Зависание было связано с инфраструктурой, его ужалось починить, а что за unknown я так и не понял, в UI показаны этапы кодогенерации, возможно действительно что-то динамически создаётся

источник

10:58пожаловаться #5

ПБ

Повелитель Бури... in Moscow Spark

спасибо!
https://sparkbyexamples.com/spark/how-to-pivot-table-and-unpivot-a-spark-dataframe/

Spark by {Examples}

How to Pivot and Unpivot a Spark DataFrame — SparkByExamples

This article describes and provides scala example on how to Pivot Spark DataFrame ( creating Pivot tables ) and Unpivot back. Pivoting is used to rotate the data from one column into multiple columns. It is an aggregation where one of the grouping columns values transposed into individual columns with distinct data.

источник

11:54пожаловаться #6

Алексей in Moscow Spark

привет, подскажите, почему bit_length нет в org.apache.spark.sql.functions , но ее вызывать через sql можно? (spark 2.3)

источник

13:17пожаловаться #7

ЕГ

Евгений Глотов... in Moscow Spark

И не только её
Используй expr("func(column)")

источник

13:26пожаловаться #8

ЕГ

Евгений Глотов... in Moscow Spark

Таков путь

источник

13:26пожаловаться #9

Алексей in Moscow Spark

спасибо

источник

13:26пожаловаться #10

2021 October 03

Никита in Moscow Spark

Всем привет!! А подскажите как бы вы прочитали в Spark sequnce-файл вида
key1\t{"a":1,"b":2}
Я знаю, что можно сделать
1) spark.read.csv(.., sep="\t"), потом from_json(col2, schema)
2) через rdd и json.loads
3) возможно как-то через newHadoopFile
4) я уверен, как-то можно через spark.read.json, но не знаю как
я понимаю, что можно сначала через csv, потом записать вторую колонку на диск, а потом прочитать через spark.read.json.
Можно ли обойтись без записи на диск?

источник

15:52пожаловаться #11

ПФ

Паша Финкельштейн... in Moscow Spark

я не понимаю в чём проблема первого подхода

источник

15:53пожаловаться #12

Никита in Moscow Spark

схема неохота писать, слишком большая, хочется чтоб инференс схемы мне всем сам сделал

источник

15:53пожаловаться #13

ЕГ