Да, как при обычном распознавании. Вообще depth map может выступать 4м цветом в домолнении к rgb, что должно хорошо поднять качество распознавания. Но и в случае, если rgb нет, depth map это та же картинка. Просто для неё нужны свои обучающие примеры.
Вот если представить depth map как ч/б картинку, что меняется с расстоянием? Цвет пикселя от 0 до 255. Что бы отличить кошку от собаки модели нужны границы объекта и взаимное расположение границ. В общем, полагаю, как и с обычными изображениями, растояние до объекта в некоторых пределах, не имеет значения, для задач object detection и image classification