Alexey Kuznetsov
Здравствуйте, в predict можно указать ntree_start и ntree_end. Если взять с 100 по 200. То будет ли прогноз осмысленным? Из теории бустинга, каждое следующее дерево обучается на ошибке всех предыдущих. Если мы выкинем первые 100 деревьев, то не будет ли прогноз хаотичным? Ведь ошибка первых 100 будет неизвестна. А вторая сотня обучена на этой ошибке первых 100. Например первые 100 улучшили модель до 90%. А вторая сотня ещё на 2%. Выкинув первые 100, не получим ли точность около 50% т.е. случайный результат?
Ненулевой ntree_start нужно использовать только в том случае, если ты по каким-то причинам решил посмотреть на предсказания без скольких-то первых деревьев. Большинству пользователей это не нужно.