А то что среднее по таргету отличается и хорошо разделяет дату это не удивительно. Но та фича которая предсказывает разность по среднему, по идеи и в регрессии должна помогать, если она в игре, то это очевидный максимум который можно выжать.
Другой вопрос, это насколько среднее точно (для теста) , ведь в итоге это всего sample, естественно тест может корректировать средние значения, но у вас то их в реале нет.