По сути задача object recognition будет занимать в среднем 2к памяти gpu на 1 камеру, какой нибудь 1080ти или 2080ти с 11гб памяти должен справляться, можно сделать так чтобы один сервер асинхронно считывал все 4 потока и ложил в какую нибудь кафку, а сервер с gpu потом будет считывать и распознавать изображения с каждого топика кафки
на основании чего расчёты? в частности почему object recognition всего 2к vram на камеру?