v
Есть таблицы в БД, есть PySpark.
Для получения колонки A нужно сделать джойн с таблицей (довольно крупной) X.
Для получения колонки B нужно сделать джойн с той же таблицей по тому же ключу.
Самое очевидное - сделать один джойн, оставив обе колонки.
Только вот проблема - все это завязано становится друг на друга. А я хочу разнести по разным функциям/объектам, так как это разные куски бизнес-логики.
Как сделать так, чтобы можно было получать отдельно результат с колонкой A, отдельно с колонкой B, и с обоими колонками, но при этом чтобы не было двух джойнов по одной и той же таблице?