Size: a a a

R language and Statistical data analysis

2020 January 13

DP

Dmitry Penzar in R language and Statistical data analysis
Бэггинг не обязательно делать на деревьях
источник

A

Andrey in R language and Statistical data analysis
Dmitry Penzar
Случайный лес это частный случай бэггинга
нет
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Пс
источник

ВК

Владимир Калинин in R language and Statistical data analysis
так и в итоге? мнения разделились..
источник

A

Andrey in R language and Statistical data analysis
Владимир Калинин
в бэггинге все фичи?
все, в этом и отличие
источник

ВК

Владимир Калинин in R language and Statistical data analysis
супер)
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Ну бэггинг основан на идее построения ансамбля из моделей на основе бустрэпных реплик
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Метод случайных подпространств - это сэмплировать фичи, а не объекты
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Можно считать это разновидностью, можно отдельно
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Но никто не запрещает делать случайный лес со всеми фичами.
источник

ВК

Владимир Калинин in R language and Statistical data analysis
т. е в багинге объекты бустрапируются, а не фичи
источник

A

Andrey in R language and Statistical data analysis
фичи вообще не бустрапируются никогда, т.к. повторная выборка одной и той же фичи не имеет смысла
источник

A

Andrey in R language and Statistical data analysis
в отличие от сэмплов
источник

ВК

Владимир Калинин in R language and Statistical data analysis
а верно, что нормализация признаков необходима только для метрических классификаторов, а например, лес к этому устойчив
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Andrey
фичи вообще не бустрапируются никогда, т.к. повторная выборка одной и той же фичи не имеет смысла
Jackknife
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Они почти эквивалентны
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Очевидно бустрэпить фичи тупо непонятно зачем. Но глубокой разницы в том, как формируются сэмплированные датасеты нет
источник

ВК

Владимир Калинин in R language and Statistical data analysis
спасибо, теперь все ясно 👍
источник

ВК

Владимир Калинин in R language and Statistical data analysis
Владимир Калинин
а верно, что нормализация признаков необходима только для метрических классификаторов, а например, лес к этому устойчив
ещё бы это уточнить)
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Деревью решений важны абсолютные пороги, потому если речь о минмакс и прочем подобном, то да
источник