Создать видимость того, что мы можем обрабатывать дохера запросов без моментальной 502 можно путём настройки размера очереди внутри uwsgi. Это параметр listen. Вбиваешь в него число побольше (например 1000) и у тебя uwsgi будет делать вид что может обработать 1000 запросов одновременно. А на самом деле он просто будет "лишние" выстраивать в очередь
listen помог в том смысле, что простаивающих процессов больше uwsgitop не показывает, и количество отказов заметно уменьшилось.
ещё помогло уменьшение количества процессов, с 8 до 4, хоть процессор и не был загружен на 100% по показаниям htop, но похоже не хватало.