400к сек это уже ОЧЕНЬ жирный. Но тут конечно зависит от того сколько ядер молотит. У меня в стриминге макс было что-то типа 5-7 млрд в трех дц на 24 партиции. И я брал где то 96 ядер кажется (с расчетом 1 ядро на одну партицию + некоторый запас). И операций никаких типа шафла и стейта не было. Фильтрануть, преобразовать из одного формата в другой, и отправить в другой кластер кафки.