Телеграмм чат группы moscowspark страница 143

А есть ли способ перехватить sigterm в драйвере или каким либо чудом выгрузить куда нибудь бродкаст переменные при прерывании StreamingContext? Или после awaitTermination еще есть доступ к sc и его бродкаст переменным ?)

источник

10:06пожаловаться #6

Denis Gabaydulin in Moscow Spark

Думаю, да. Это же jvm app. SignalHandler должен помочь.

источник

11:03пожаловаться #7

Denis Gabaydulin in Moscow Spark

Но возможно в самом спарке есть listner для этого (там их до черта, в API).

источник

11:05пожаловаться #8

Gev in Moscow Spark

Народ. Образовалась такая проблема:
1. Читаю данные из AVRO файла dataframe
2. Делаю Cast преобразование для поля Long в timestamp
3. Пишу полученый dataframe в формате orc в другую папку.
4. Сравниваю timestamp в исходном dataframe и в полученном и они расходятся на доли секунд (в полученом на доли секунд больше

источник

14:33пожаловаться #9

Gev in Moscow Spark

val df_avro = spark.read.format("com.databricks.spark.avro").load("/data")
val df_avro1 = df_avro.withColumn("UPDATE_DT", (df_avro("UPDATE_DT") / 1000).cast("timestamp"))
df_avro1.repartition(1).write.mode("overwrite").format("orc").option("compression", "snappy").save("/data/tmp")
val df_orc = spark.read.format("orc").load("/data/tmp")

df_avro.withColumn("UPDATE_DT", (df_avro("UPDATE_DT") / 1000).cast("timestamp")).select("*").where ("ID=1").show(10,false)
df_orc.select("*").where ("ID=1").show(10,false)
+--------+-----------------------+
|ID | UPDATE_DT |
+--------+-----------------------+
|1 |2017-01-07 21:35:24.538|
+--------+-----------------------+

+--------+-----------------------+
|ID | UPDATE_DT |
+--------+-----------------------+
|1 |2017-01-07 21:35:25.076|
+--------+-----------------------+

источник

14:37пожаловаться #10

Pavel Klemenkov in Moscow Spark

Забавно

источник

14:40пожаловаться #11

Grigory Pomadchin in Moscow Spark

Даже не знаю что сказать) что-то не сходится)

источник

14:40пожаловаться #12

Grigory Pomadchin in Moscow Spark

если воспроизводимый пример будет, то можно будет посмотреть в чем дело