Здравствуйте, в теории древовидные модели не чувствительны к шкале количественного признака, т.е. данные не обязательно нормировать, шкалировать, и логарифмировать. Я правильно понимаю что это в полной мере относиться и к катбусту? Насколько он чувствителен к выбросам?
> не обязательно нормировать, шкалировать, и логарифмировать Да, не нужно. > Насколько он чувствителен к выбросам? Нужно проверять на конкретных данных.
> не обязательно нормировать, шкалировать, и логарифмировать Да, не нужно. > Насколько он чувствителен к выбросам? Нужно проверять на конкретных данных.
А что лучше делать с выбросами, по вашему опыту - менять на квантили, логарифм...?
Это dummy решение, меня интересует как работает оверфитинг детектор (у меня он почему то неработает), можно ли управлять высотой шириной, делением дерева, прунинг во общем тонкая настройка нужна, есть что то?
ОК, ожидал правда ответ в стиле: у нас реализованы параметры n1_parameter, n2_parameter, ... nn_parameter. Параметер: на практике использование параметра n1 - дает такие резальтаты, параметр n2 - лучше исользовать в пределах [10**-1:10**-2]