Привет,
В торче и ТФ у батчнормы есть параметр моментум.
На основе какой статьи или материала он используется в разных имплементациях ?
У меня батч норм = 1 (так ограничен алгоритм в данном виде),
я нашел эту статью:
https://www.ecva.net/papers/eccv_2020/papers_ECCV/papers/123570222.pdfкоторая говорит в целом о проблематичности батча размером в 1 в контексте батч нормы, и предлагает MBN,
Momentum Batch Norm, задумался, а не то ли это, что есть в торче, тф и т.д ?
Что еще можете сказать полезного про сетку с батчнормами и батчем размером в 1 ?
в статье даже пишется что это "open problem".