Если брать актуальные библиотеки для бустинга, то там для количественных фич как минимум в виде опции (а может и по умолчанию) используется гистограммирование. Поэтому пребразования данных могут влиять на выбор оптимальных сплитов
Если брать актуальные библиотеки для бустинга, то там для количественных фич как минимум в виде опции (а может и по умолчанию) используется гистограммирование. Поэтому пребразования данных могут влиять на выбор оптимальных сплитов
Лес - бэггинг на деревьях + метод случайных подпространств
Можно второе не использовать, иногда по умолчанию и не используют. Кроме того, метод случайных подпространств от сэмплирования объектов отличается вопросом брать колонки или строки матрицы
Можно второе не использовать, иногда по умолчанию и не используют. Кроме того, метод случайных подпространств от сэмплирования объектов отличается вопросом брать колонки или строки матрицы
велосипед от мотоцикла отличается отсутствием двигателя. Есть ли между ними принципиальная разница? Колес-то в типичном случае по 2 и там, и там