т.е. есть данные, на которых можно учиться, но есть и те данные, которые не должны покидать пределы персонального хранилища. Поэтому тут всё, конечно, не так просто.
Я думаю, вам следует начинать не с обучения сеток, а с правовых вопросов при обкатке вашей идеи. Облако, шмоблако, персональное, публичное.. это все решаемо технически
И да, распознавание лиц в реальной обстановке это по-прежнему сложная задача, уж не знаю каких вы там Labelled faces in the wild и дипфейсов начитались 😉