k
Size: a a a
k
ПФ
k
ПФ
k
ПФ
k
ПФ
k
>>> df = spark.createDataFrame([(1,2), (3,4)], ['a', '0'])
>>> df.show()
+---+---+
| a| 0|
+---+---+
| 1| 2|
| 3| 4|
+---+---+
>>> for i in range(1, 500):
... df = df.withColumn(str(i), abs(col(str(i-1))))
... >>>GP
GP
ПФ
CO
my_col = ['id', 'name', 'type_name', 'date_from', 'action']
my_data = [
['16763', 'p1', 'type1', '2021-01-01', 'action1'],
['16763', 'p1', 'type2', '2021-01-10', 'action1'],
['16763', 'p1', 'type3', '2021-01-15', 'action3'],
['19622', 'p2', 'type1', '2021-01-05', 'action1'],
['19799', 'p3', 'type2', '2021-01-02', 'action2'],
['19799', 'p3', 'type1', '2021-01-10', 'action1']
]
my_df = spark.createDataFrame(my_data, my_col)
Хочу получить значение на каждый день (отдельный df календарь есть)+-----+----+----------+----------+----------+-------+
| id|name| date_rep| date_from| date_to| action|
+-----+----+----------+----------+----------+-------+
|19799| p3|2021-01-02|2021-01-02|2021-01-09|action2|
|19799| p3|2021-01-03|2021-01-02|2021-01-09|action2|
|19799| p3|2021-01-04|2021-01-02|2021-01-09|action2|
|19799| p3|2021-01-05|2021-01-02|2021-01-09|action2|
|19799| p3|2021-01-06|2021-01-02|2021-01-09|action2|
|19799| p3|2021-01-07|2021-01-02|2021-01-09|action2|
|19799| p3|2021-01-08|2021-01-02|2021-01-09|action2|
|19799| p3|2021-01-09|2021-01-02|2021-01-09|action2|
|19799| p3|2021-01-10|2021-01-10|2021-01-20|action1|
|19799| p3|2021-01-11|2021-01-10|2021-01-20|action1|
|19799| p3|2021-01-12|2021-01-10|2021-01-20|action1|
|19799| p3|2021-01-13|2021-01-10|2021-01-20|action1|
|19799| p3|2021-01-14|2021-01-10|2021-01-20|action1|
|19799| p3|2021-01-15|2021-01-10|2021-01-20|action1|
|19799| p3|2021-01-16|2021-01-10|2021-01-20|action1|
|19799| p3|2021-01-17|2021-01-10|2021-01-20|action1|
|19799| p3|2021-01-18|2021-01-10|2021-01-20|action1|
|19799| p3|2021-01-19|2021-01-10|2021-01-20|action1|
|19799| p3|2021-01-20|2021-01-10|2021-01-20|action1|
+-----+----+----------+----------+----------+-------+
Подскажите, как возможно реализовать?ЕГ
ПФ
ЕГ
ЕГ
CO
ЕГ
CO