Слушайте, а кто что вообще слышал про регуляризацию весов в DL?
Когда применяется и почему не так распространенно, как в линейных моделях?
Я вот читаю
https://arxiv.org/pdf/1802.05957.pdf про spectral normalization, еще в недавней stylegan2 тоже была нормализация весов, аналогичная той, что в работе AlexNet использовалась.