Size: a a a

Боль Тимлида

2021 August 18

PD

Phil Delgyado in Боль Тимлида
Аггрегация - в смысле группировка с выбором последнего, а не суммирование.
И все суммирование нужно делать поверх этой группировки в том же запросе
источник

IA

Igor A in Боль Тимлида
Угу. Так и делаем. Все пашет
источник

IA

Igor A in Боль Тимлида
Выбор последнего делает какойто мерж tree по таймстемпу
источник

PD

Phil Delgyado in Боль Тимлида
Ну, merge tree по таймстемпу не дает гарантий.
Т.е. оно у вас работает, вам везет. Но гарантий - нет.
источник

IA

Igor A in Боль Тимлида
ArgMax
источник

IA

Igor A in Боль Тимлида
Я не хочу писать sql сюда. Суть как по ссылке выше
источник

PD

Phil Delgyado in Боль Тимлида
Прямо в запросе в конце или на matview?
Если второе - то у тебя в matview могут быть дубликаты, если для этой партиции будет два файла с мерджами.
Сведение до одного - не гарантируется CH
источник

IA

Igor A in Боль Тимлида
И там и там. Matview просто уменьшает объемы
источник

IA

Igor A in Боль Тимлида
Я и написал что оптимизация такая вот... попробовали как в статье и лучше оно
источник

PD

Phil Delgyado in Боль Тимлида
Хм, в статье-же не про оптимизацию, там про три стратегии дедупликации, из которых реально работает только первая, которая про "делать запрос с агрегацией сразу"
источник

IA

Igor A in Боль Тимлида
полез смотреть
источник

IA

Igor A in Боль Тимлида
скроллюю вниз. вижу запрос
источник

IA

Igor A in Боль Тимлида
источник

IA

Igor A in Боль Тимлида
>из которых реально работает только первая
это не понял
источник

IA

Igor A in Боль Тимлида
вот запрос. как он выдаст дубликаты?
источник

PD

Phil Delgyado in Боль Тимлида
Так это первая стратегия и есть. И да, сам запрос - не выдаст.
А вот если это запрос генерации matview, то в matview дубликаты уже могут быть
источник

IA

Igor A in Боль Тимлида
видимо или я или ты не до конца понял статью
источник

IA

Igor A in Боль Тимлида
я понял как - matview клевая оптимизация, сэкономишь место и ram, поверх нее еще сделай вот такой запрос
источник

IA

Igor A in Боль Тимлида
вообще поддержка меняющихся данных в CH сделана из рук вон плохо
источник

IA

Igor A in Боль Тимлида
с неизменными все отлично
источник