Подскажите, имеется таблица Replacing merge tree. В нее каждый день дописываются данные за сегодня и за вчера.
Сегодня обнаружили что данные за 2021-03-30 до сих пор не схлопнулись. Возможна ли эта проблема из-за не выставленных конфигураций сервера?
Сделайте OPTIMIZE FINAL для таблицы (или только проблемного партишна той таблицы), - если OPTIMIZE успешно отработает и ваши записи схлопнутся - значит кликхаус просто до тех записей ещё не добрался (Replacing гарантий по времени схлопывания не даёт) . (Или же, вместо OPTIMIZE FINAL, можно в тот же SELECT, которым вы проверяли дубли, добавить после имени таблицы FINAL - останутся ли тогда дубли?). Это одна ситуация, когда на самом деле всё как положено работает.
И если вы знаете, что из систем-источников данные "за несколько дней назад" уже больше поступать не должны, а дубли в старых данных не устраивают - как вариант каким-нибудь ночным OPTIMIZE FINAL схлопывание поторопить.
А вот если останутся не схлопнутыми - с этим стоит разобраться. Может быть какая-то ошибка схемы. Например, не будут схлопываться между собой записи, находящиеся в разных партициях.