Size: a a a

R language and Statistical data analysis

2020 January 13

A

Andrey in R language and Statistical data analysis
Dmitry Penzar
Деревью решений важны абсолютные пороги, потому если речь о минмакс и прочем подобном, то да
снова нет
источник

A

Andrey in R language and Statistical data analysis
Если брать актуальные библиотеки для бустинга, то там для количественных фич как минимум в виде опции (а может и по умолчанию) используется гистограммирование. Поэтому пребразования данных могут влиять на выбор оптимальных сплитов
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Andrey
снова нет
А первое какое было:?
источник

A

Andrey in R language and Statistical data analysis
Dmitry Penzar
Случайный лес это частный случай бэггинга
это
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Пс
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Тут неправы вы.
источник

A

Andrey in R language and Statistical data analysis
прав, читай определение https://en.wikipedia.org/wiki/Bootstrap_aggregating
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Andrey
Если брать актуальные библиотеки для бустинга, то там для количественных фич как минимум в виде опции (а может и по умолчанию) используется гистограммирование. Поэтому пребразования данных могут влиять на выбор оптимальных сплитов
Гистограмма изменится от деления на число?
источник

A

Andrey in R language and Statistical data analysis
Лес - бэггинг на деревьях + метод случайных подпространств
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Andrey
Лес - бэггинг на деревьях + метод случайных подпространств
Можно второе не использовать, иногда по умолчанию и не используют. Кроме того, метод случайных подпространств от сэмплирования объектов отличается вопросом брать колонки или строки матрицы
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Потому я принципиальной разницы не вижу
источник

A

Andrey in R language and Statistical data analysis
Dmitry Penzar
Можно второе не использовать, иногда по умолчанию и не используют. Кроме того, метод случайных подпространств от сэмплирования объектов отличается вопросом брать колонки или строки матрицы
велосипед от мотоцикла отличается отсутствием двигателя. Есть ли между ними принципиальная разница? Колес-то в типичном случае по 2 и там, и там
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Насчет нормализации - я указал, какие не будут влиять. Если брать не дефолтные, то вполне может
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Гистограмма если меняется от деления на число - это будет номер
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Andrey
велосипед от мотоцикла отличается отсутствием двигателя. Есть ли между ними принципиальная разница? Колес-то в типичном случае по 2 и там, и там
Ложная аналогия.
источник

A

Andrey in R language and Statistical data analysis
Dmitry Penzar
Гистограмма если меняется от деления на число - это будет номер
нормализация - это не деление на число
источник

A

Andrey in R language and Statistical data analysis
не надо придумывать свою терминологию и выдавать за общепринятую, это путает ньюфагов
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Эм?
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Минмакс делает что-то сильно отличгое?
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Dmitry Penzar
Насчет нормализации - я указал, какие не будут влиять. Если брать не дефолтные, то вполне может
Еще раз.
источник