Size: a a a

2021 October 01

ПБ

Повелитель Бури... in Moscow Spark
Доброе утро! А pivot без sql можно сделать?
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Ну Эксель умеет например
источник

ПФ

Паша Финкельштейн... in Moscow Spark
df.groupBy("A", "B").pivot("C").sum("D")
источник

ПФ

Паша Финкельштейн... in Moscow Spark
В функцию pivot можно передать сиквенс уникальных значений колонки C
источник

VV

Vladislav Verba in Moscow Spark
Delta 1.0.0
Зависание было связано с инфраструктурой, его ужалось починить, а что за unknown я так и не понял, в UI  показаны этапы кодогенерации, возможно действительно что-то динамически создаётся
источник

ПБ

Повелитель Бури... in Moscow Spark
источник

А

Алексей in Moscow Spark
привет, подскажите, почему bit_length нет в org.apache.spark.sql.functions , но ее вызывать через sql можно? (spark 2.3)
источник

ЕГ

Евгений Глотов... in Moscow Spark
И не только её
Используй expr("func(column)")
источник

ЕГ

Евгений Глотов... in Moscow Spark
Таков путь
источник

А

Алексей in Moscow Spark
спасибо
источник
2021 October 03

Н

Никита in Moscow Spark
Всем привет!! А подскажите как бы вы прочитали в Spark sequnce-файл вида
key1\t{"a":1,"b":2}
Я знаю, что можно сделать
1) spark.read.csv(.., sep="\t"), потом from_json(col2, schema)
2) через rdd и json.loads
3) возможно как-то через newHadoopFile
4) я уверен, как-то можно через spark.read.json, но не знаю как
я понимаю, что можно сначала через csv, потом записать вторую колонку на диск, а потом прочитать через spark.read.json.
Можно ли обойтись без записи на диск?
источник

ПФ

Паша Финкельштейн... in Moscow Spark
я не понимаю в чём проблема первого подхода
источник

Н

Никита in Moscow Spark
схема неохота писать, слишком большая, хочется чтоб инференс схемы мне всем сам сделал
источник

ЕГ

Евгений Глотов... in Moscow Spark
По всему файлу одинаковая, или может быть разная?
источник

Н

Никита in Moscow Spark
одинаковая
источник

ЕГ

Евгений Глотов... in Moscow Spark
Есть спарк-функция schema_from_json, первую строку копируешь и подаёшь её в lit
источник

ЕГ

Евгений Глотов... in Moscow Spark
Или как-то так, название забыл
источник

ЕГ

Евгений Глотов... in Moscow Spark
Берёшь эту схему, она в simpleString
источник

ЕГ

Евгений Глотов... in Moscow Spark
Пишешь код, который конвертит simpleString в StructType
источник

ЕГ

Евгений Глотов... in Moscow Spark
Применяешь его во from_json
источник