Всем привет, такой вопрос (AWS Athena + AWS GLUE)
У меня есть словарь он может только увеличиваться, представте себе что это журнал вакцинированных заполняется в GoogleSheet
Дата || ФИО
я планирую добавить еще одно поле
.withColumn('sys_updated_time', F.from_utc_timestamp(F.current_timestamp(),"Europe/Kiev"))
.withColumn('dates', F.to_date('sys_updated_time'))
и по полю dates делать партию,
.repartition("dates")
.partitionBy("dates")
получится что у меня на каждый день будет актуальные данные.
В самой БД (AWS Athena), сделать view где будет
select * from my_vacsnations_guys where dates = current_date
Это нормальная практика или нужно делать SCD2 ?
Спасибо за внимание