Size: a a a

Боль Тимлида

2021 August 18

PD

Phil Delgyado in Боль Тимлида
Э, и как через mat view?
источник

IA

Igor A in Боль Тимлида
Выше ссылка
источник

PD

Phil Delgyado in Боль Тимлида
Ни один из описанных там способов не гарантирует отсутствие дубликатов, увы.
OPTIMIZE FINAL DEDUPLICAE гарантирует, но он реально долго работает (и не понятно, что при этом происходит с matview на его основе, скорее всего ничего, т.е. для них нужно тоже запускать OPTIMIZE, что еще дольше)
источник

c

critskiy in Боль Тимлида
Он вроде только на MergeTree или я упустил момент, когда и для Replacing стало возможным? Хотя если подумать, то ReplacingMergeTree относится к семейству основному... 🤔
источник

PD

Phil Delgyado in Боль Тимлида
Он для всего семейства, насколько я помню.
источник

c

critskiy in Боль Тимлида
Хмм, посмотрю (упустиль) :D
источник

PD

Phil Delgyado in Боль Тимлида
"The OPTMIZE query is supported for MergeTree family, the MaterializedView and the Buffer engines"
"If you specify DEDUPLICATE, then completely identical rows (unless by-clause is specified) will be deduplicated (all columns are compared), it makes sense only for the MergeTree engine."
источник

c

critskiy in Боль Тимлида
Неее, это я помню первое, но вот второе, как раз для DEDUPLICATE, у меня вызывает сомнения...
источник

c

critskiy in Боль Тимлида
Кароч ладно, надо работать 😅
источник

IA

Igor A in Боль Тимлида
Да там предагрегат смысл которого - убавить объем
Для гарантии доп select делаешь
источник

PD

Phil Delgyado in Боль Тимлида
Ну вот да, без агрегации в каждом из запросе - никакая дедупликация не работает, увы.
источник

IA

Igor A in Боль Тимлида
Ну для аналитики раз в день норм
источник

IA

Igor A in Боль Тимлида
Тут шел срач что нельзя убрать дубли никак и ch сломан от природы, на что я возразил что все отлично пашет
источник

c

critskiy in Боль Тимлида
я утверждал где-то что КХ сломан от природы, кхм?
источник

PD

Phil Delgyado in Боль Тимлида
Убрать из хранилища - никак.
Аггрегировать при каждом конкретном запросе - можно, но не бесплатно и довольно сложно для пользователя (он должен про это помнить)
источник

IA

Igor A in Боль Тимлида
Речь шла про запрос который считает деньги
источник

PD

Phil Delgyado in Боль Тимлида
Ты говорил "matview", но это решение не работает (
источник

IA

Igor A in Боль Тимлида
Нет. Прочитай сначала. Я говорил про 3 слоя аггрегации + final вконце. слои нужны просто чтобы оптимальнее работало
источник

PD

Phil Delgyado in Боль Тимлида
Ну так и final не гарантирует, нужна агрегация в конце и только так.
источник

PD

Phil Delgyado in Боль Тимлида
Промежуточные слои через matview не дают никаких гарантий вообще.
источник