Size: a a a

2018 October 12

OT

Olga Tsvetkova in catboost_ru
Nikita Dmitriev
Привет!
А можешь поподробнее рассказать для чего берут первые 1000 наблюдений? И в каком описании ты это прочитала?)
сейчас не могу это найти( возможно я это перепутала с кол-вом деревьев, но мне казалось я это видела(
Видимо, если я ошиблась, то главная проблема это не переобучиться только. Я попробую найти где я это могла прочитать
источник

OT

Olga Tsvetkova in catboost_ru
Nikita Dmitriev
Привет!
А можешь поподробнее рассказать для чего берут первые 1000 наблюдений? И в каком описании ты это прочитала?)
Нашла, я это прочитала в алгоритме работы matrixnet в «просеивании данных», и так как catboost основан на matrixnet, думала это тоже тут работает
источник

ND

Nikita Dmitriev in catboost_ru
В общем стоит попробовать обучить катбуст на такой выборке и посмотреть что получится)
источник

DT

Dmitry Torshin in catboost_ru
А у кого-нибудь бывал баг, что размер feature_importance меньше, чем число признаков?
источник

ke

k e in catboost_ru
Dmitry Torshin
А у кого-нибудь бывал баг, что размер feature_importance меньше, чем число признаков?
Привет! В  feature_importance указаны только те признаки, которые используются в модели, это могут быть не все признаки
источник

DT

Dmitry Torshin in catboost_ru
Ведь есть же признаки с 0 важностью... И как узнать тогда, что пропущено? Prettify плохо обрабатывает случай, если название фичи имеет символы из кириллицы
источник

AD

Anna Veronika Dorogush in catboost_ru
есть issue активный по этому поводу, можно там следить за прогрессом https://github.com/catboost/catboost/issues/492
источник

DT

Dmitry Torshin in catboost_ru
У меня просто ощущение, что пропущена именно последняя фича, порядок тот же самый остаётся(сопоставил ранжирование признаков по весам)
источник

AD

Anna Veronika Dorogush in catboost_ru
по каким весам?
источник

AD

Anna Veronika Dorogush in catboost_ru
самый простой способ смотреть на импортансы - используй pretified=True, тогда у тебя будут отсортированные по импортансу фичи и их имена либо индексы при отсутствии имен
источник

SK

Stanislav Kirillov in catboost_ru
Dmitry Torshin
У меня просто ощущение, что пропущена именно последняя фича, порядок тот же самый остаётся(сопоставил ранжирование признаков по весам)
а какая у тебя версия катбуста?
источник

SK

Stanislav Kirillov in catboost_ru
в 0.10.3 в питоне все ок теперь (в cli фикс выкатится скоро)
источник

SK

Stanislav Kirillov in catboost_ru
источник

DT

Dmitry Torshin in catboost_ru
Anna Veronika Dorogush
самый простой способ смотреть на импортансы - используй pretified=True, тогда у тебя будут отсортированные по импортансу фичи и их имена либо индексы при отсутствии имен
prettify - не умеет в кириллицу
источник

DT

Dmitry Torshin in catboost_ru
0.10.2
источник

SK

Stanislav Kirillov in catboost_ru
вчера зарелизили 0.10.3, теперь информация про неиспользуемые фичи из модели не дропается
источник

DT

Dmitry Torshin in catboost_ru
ValueError: <class 'catboost.widget.ipythonwidget.MetricVisualizer'> is not in list 😔
источник

AD

Anna Veronika Dorogush in catboost_ru
Ошибки лучше всего репортить в issues.
источник

DT

Dmitry Torshin in catboost_ru
Перезапущу ноутбук, отпишусь через часик
источник

DT

Dmitry Torshin in catboost_ru
Помогло 👌👍
источник