Телеграмм чат группы rlang

2020 January 13

A

Andrey in R language and Statistical data analysis

Dmitry Penzar

Деревью решений важны абсолютные пороги, потому если речь о минмакс и прочем подобном, то да

снова нет

источник

21:26пожаловаться #1

A

Andrey in R language and Statistical data analysis

Если брать актуальные библиотеки для бустинга, то там для количественных фич как минимум в виде опции (а может и по умолчанию) используется гистограммирование. Поэтому пребразования данных могут влиять на выбор оптимальных сплитов

источник

21:28пожаловаться #2

DP

Dmitry Penzar in R language and Statistical data analysis

Andrey

снова нет

А первое какое было:?

источник

21:29пожаловаться #3

A

Andrey in R language and Statistical data analysis

Dmitry Penzar

Случайный лес это частный случай бэггинга

это

источник

21:29пожаловаться #4

DP

Dmitry Penzar in R language and Statistical data analysis

Пс

источник

21:29пожаловаться #5

DP

Dmitry Penzar in R language and Statistical data analysis

Тут неправы вы.

источник

21:29пожаловаться #6

A

Andrey in R language and Statistical data analysis

прав, читай определение https://en.wikipedia.org/wiki/Bootstrap_aggregating

Wikipedia

Bootstrap aggregating

machine learning algorithm

источник

21:31пожаловаться #7

DP

Dmitry Penzar in R language and Statistical data analysis

Andrey

Если брать актуальные библиотеки для бустинга, то там для количественных фич как минимум в виде опции (а может и по умолчанию) используется гистограммирование. Поэтому пребразования данных могут влиять на выбор оптимальных сплитов

Гистограмма изменится от деления на число?

источник

21:31пожаловаться #8

A

Andrey in R language and Statistical data analysis

Лес - бэггинг на деревьях + метод случайных подпространств

источник

21:31пожаловаться #9

DP

Dmitry Penzar in R language and Statistical data analysis

Andrey

Лес - бэггинг на деревьях + метод случайных подпространств

Можно второе не использовать, иногда по умолчанию и не используют. Кроме того, метод случайных подпространств от сэмплирования объектов отличается вопросом брать колонки или строки матрицы

источник

21:33пожаловаться #10

DP

Dmitry Penzar in R language and Statistical data analysis

Потому я принципиальной разницы не вижу

источник

21:33пожаловаться #11

A

Andrey in R language and Statistical data analysis

Dmitry Penzar

Можно второе не использовать, иногда по умолчанию и не используют. Кроме того, метод случайных подпространств от сэмплирования объектов отличается вопросом брать колонки или строки матрицы

велосипед от мотоцикла отличается отсутствием двигателя. Есть ли между ними принципиальная разница? Колес-то в типичном случае по 2 и там, и там

источник

21:34пожаловаться #12

DP

Dmitry Penzar in R language and Statistical data analysis

Насчет нормализации - я указал, какие не будут влиять. Если брать не дефолтные, то вполне может

источник

21:34пожаловаться #13

DP

Dmitry Penzar in R language and Statistical data analysis

Гистограмма если меняется от деления на число - это будет номер

источник