Может кто сталкивался:
строю линейную модель
у меня есть 3 категориальных переменные, в каждой примерно ~ 500 разных значений
делаю one-hot-encodding, кодирую 0 и 1
Помимо этого есть еще 3 числовых предиката - по хорошему их надо как-то отскалировать, знаю два популярных способа: (x - min(x)) / (max(x) -min(x)) и (x - mean(x))/sd(x)
Влияют ли как-то переменные, полученные из one-hot encodding на выбор как нужно скалировать переменные?
извините за слово "скалировать", вылетело из головы, как сказать это по-русски