ну мы в своё время там порядочно логики в сопроцессоры запихнули
в итоге если нету сериализации-десириализации данных(а в случае сопроцессоров этого нету), то достаточно большие агрегаты считало в миллисекунды
ну и конечно нужно было сплитер правильный проставить, чтобы не ходило в соседний регион, а по указанному агрегату на одном сервере было
тащить все данные на клиента, чтобы потом сделать агрегацию не обязательно