мне просто интересно вот из опыта людей которые сталкивались, например есть хайв и так сложилось что есть дубликаты за какую ту партицию (пускай будет партиция = день, самый элементарный) и вот нужно сделать дедупликацию, вариант первый это дедублицировать через спарк перезаписывая партиции полностью, а какие еще варианты можно применить, возможно нетривиальные?