Телеграмм чат группы catboost

Здравствуйте, в predict можно указать ntree_start и ntree_end. Если взять с 100 по 200. То будет ли прогноз осмысленным? Из теории бустинга, каждое следующее дерево обучается на ошибке всех предыдущих. Если мы выкинем первые 100 деревьев, то не будет ли прогноз хаотичным? Ведь ошибка первых 100 будет неизвестна. А вторая сотня обучена на этой ошибке первых 100. Например первые 100 улучшили модель до 90%. А вторая сотня ещё на 2%. Выкинув первые 100, не получим ли точность около 50% т.е. случайный результат?

источник

19:09пожаловаться #9

AD

Anna Veronika Dorogu... in catboost_ru

Alexey Kuznetsov

Здравствуйте, в predict можно указать ntree_start и ntree_end. Если взять с 100 по 200. То будет ли прогноз осмысленным? Из теории бустинга, каждое следующее дерево обучается на ошибке всех предыдущих. Если мы выкинем первые 100 деревьев, то не будет ли прогноз хаотичным? Ведь ошибка первых 100 будет неизвестна. А вторая сотня обучена на этой ошибке первых 100. Например первые 100 улучшили модель до 90%. А вторая сотня ещё на 2%. Выкинув первые 100, не получим ли точность около 50% т.е. случайный результат?

Ненулевой ntree_start нужно использовать только в том случае, если ты по каким-то причинам решил посмотреть на предсказания без скольких-то первых деревьев. Большинству пользователей это не нужно.

источник

19:23пожаловаться #10

A

Alexey Kuznetsov in catboost_ru

У вас последующие деревья учатся на ошибках предыдущих?

источник

19:25пожаловаться #11

AU

Aleksei Ustimenko in catboost_ru

Это вполне осмысленная операция, если используется model shrinkage, например

источник

19:29пожаловаться #12

A

Alexey Kuznetsov in catboost_ru

У вас последующие деревья учатся на ошибках предыдущих?

источник

19:35пожаловаться #13

AU

Aleksei Ustimenko in catboost_ru

А как можно иначе?

источник

19:36пожаловаться #14

A

Alexey Kuznetsov in catboost_ru

Хорошо. Спасибо. Тогда в прогнозе на средних деревьях без первых смысла точно нет, как и в shrink- е. Может быть они что то и дадут при eta =0.0001. но при 0.1 и выше без 10 первых деревьев результат прогноза будет плохой

источник

19:46пожаловаться #15

AU

Aleksei Ustimenko in catboost_ru

Не всегда, повторю, при model shrinkage первые деревья почти нулевые получаются

источник

19:46пожаловаться #16

AU

Aleksei Ustimenko in catboost_ru

Это если выставлена опция —model-shrink-rate

источник

19:47пожаловаться #17