прикол в том, что если e - нормально-распределенная случайная величина, то и e + e, и e - e будет тоже нормально-распределенной, только с дисперсией в два раза больше
тут, кстати, валидация не так чтоб критично решает, надо сказать. Когда у тебя 1.7 млн строк и ты измеряешь качество только на отложенной выборке в 1млн наблюдений - это еще не самый плохой вариант