VI
Size: a a a
VI
ЕГ
VI
VI
D
CO
df = (
df
.withColumn('reason', F.when(F.col('reason')=="", None))
.withColumn('sys_updated_by', F.lit(args['JOB_NAME']))
.withColumn('sys_updated_time', F.from_utc_timestamp(F.current_timestamp(),"Europe/Kiev"))
)
print(df.groupBy('reason').agg({'id':'count'}).show(truncate=False))
+------+---------+
|reason|count(id)|
+------+---------+
|null |3382809 |
+------+---------+
По факту, там много разного текста и есть пусто, есть пробел и есть нулл, а мне по этому полю нужно партию сделать.ЕГ
CO
ЕГ
ЕГ
ЕГ
ЕГ
CO
CO
CO
CO
ЕГ
CO
CO
AN