Size: a a a

2018 October 09

В

Витя in catboost_ru
Смотри Feature Preparation
источник

PB

Pavel Baidaus in catboost_ru
Проиндексировал такой функцией Train['T1'] = pd.factorize(Train['T1'])[0] тип данных изменился с T1 object на T1       int64 категории стали цифрами в датасете но модель все равно выдает ошибку  CatboostError: Invalid cat_features[0] = T1 value type=<class 'str'>: must be int().
источник

PB

Pavel Baidaus in catboost_ru
что то явно делаю не так((
источник

RS

Rinat Safianov in catboost_ru
Тут получение списка категорийных признаков.
источник

RS

Rinat Safianov in catboost_ru
Тут их скармливание.
источник

SI

Sergey Ivanov in catboost_ru
А как-то можно продолжить тренинг, сразу после того как обучился? То есть, чтобы второй раз он не с нуля обучался, а продолжил обучение с того места, на чем закончил?
источник

SI

Sergey Ivanov in catboost_ru
Пока вижу https://github.com/catboost/catboost/issues/464, но оба решения не подходят.
источник

SI

Sergey Ivanov in catboost_ru
baseline требует, чтобы сначала был применен model.predict, а snapshot будет доделывать то количество итераций, которое было не закончено при первом model.fit
источник

DK

Dmitriy Kruchinin in catboost_ru
источник

SI

Sergey Ivanov in catboost_ru
Ответил выше почему это не подходит.
источник

SK

Stanislav Kirillov in catboost_ru
параметр количество итераций переопределяет то, что записано в снепшоте, у нас даже тест про это есть
источник

SK

Stanislav Kirillov in catboost_ru
источник

SK

Stanislav Kirillov in catboost_ru
тут сначала учится 15 итераций со снепшотом, потом учится с теми же параметрами до 30 итераций
источник

SI

Sergey Ivanov in catboost_ru
Ты имеешь в виду вот так:
model = CatBoostClassifier(iterations = 50, save_snapshot=True, snapshot_file='exp.snapshot', snapshot_interval=3)
model.fit(X, y, cat_indices)
model = CatBoostClassifier(iterations = 100, ave_snapshot=True, snapshot_file='exp.snapshot', snapshot_interval=3)
model.fit(X, y, cat_indices)
источник

SK

Stanislav Kirillov in catboost_ru
Ага, так
источник

SK

Stanislav Kirillov in catboost_ru
в конце обучения снепшот всегда пишется, даже если snapshot_interval не прошел
источник

SI

Sergey Ivanov in catboost_ru
Круто, спасибо, я счастлив.
источник
2018 October 11

AB

Andrey Berezovskiy in catboost_ru
Anna Veronika Dorogush
Всех приглашаем на PyData Moscow 13 октября! Там мы проведем туториал по решению задач классификации при помощи катбуста: https://events.yandex.ru/events/ds/13-october-2018/
Огромное спасибо за трансляцию!
источник

OT

Olga Tsvetkova in catboost_ru
Добрый день! Ребят, подскажите, стоит ли использовать катбуст на маленьких данных? (Обучающая выборка 1000) Я читала в описании катбуста, что для случайной подвыборки берут 1000 первых наблюдений, а дальше случайно выбирают. Что будет происходить в случае маленькой выборки?
источник
2018 October 12

ND

Nikita Dmitriev in catboost_ru
Olga Tsvetkova
Добрый день! Ребят, подскажите, стоит ли использовать катбуст на маленьких данных? (Обучающая выборка 1000) Я читала в описании катбуста, что для случайной подвыборки берут 1000 первых наблюдений, а дальше случайно выбирают. Что будет происходить в случае маленькой выборки?
Привет!
А можешь поподробнее рассказать для чего берут первые 1000 наблюдений? И в каком описании ты это прочитала?)
источник