Anton Kondakov
Я уже наступал на эти грабли :( Это должно аффектить общее количество партов по таблице, но оно одинаковое
вы неправильно понимаете
>аффектить общее количество партов по таблице, но оно одинаковое
это неверно
самое главное сколько разных logid прилетает из кафки за раз. Инсерт на стейдже у вас разбивается на "5" партов, на проде на "500"
Т.е. у меня есть похожая тема, PARTITION BY (logid, toStartOfDay(timestamp)). Я там сделал кол-во топиков по кол-ву logid, каждый logid в свой топик и из кафки тянется и пишется раздельно, чтобы в одном батче / insert-е был только один уникльный logid.