Ну можно подобрать такие точки на плоскости Оyх1 и Oyx2, которые будут с нулевым мат.ожиданием и стандартным отклонением 1, мнк даст плоскости с большим тангенсом на одной и небольшим на другой
Убираем бОльший коэффициент и какой-нибудь L2 даст меньшую ошибку, чем если бы мы убрали меньший, потому что на одной плоскости было 2 точки, а на другой - много
Как-то так на пальцах