Прямо в запросе в конце или на matview? Если второе - то у тебя в matview могут быть дубликаты, если для этой партиции будет два файла с мерджами. Сведение до одного - не гарантируется CH
Хм, в статье-же не про оптимизацию, там про три стратегии дедупликации, из которых реально работает только первая, которая про "делать запрос с агрегацией сразу"