Size: a a a

2019 February 08

MK

Maxim Khrisanfov in catboost_ru
привет, в документации много инфы и тут примеры https://github.com/catboost/tutorials
источник

MK

Maxim Khrisanfov in catboost_ru
Pool что-то типа контейнера для данных
источник

MK

Maxim Khrisanfov in catboost_ru
источник

SZ

Sasha Zhu in catboost_ru
Я правильно понимаю, что в пул пробрасывается датасет?
источник

MK

Maxim Khrisanfov in catboost_ru
да
источник

SZ

Sasha Zhu in catboost_ru
Документацию читала, ага
источник

SZ

Sasha Zhu in catboost_ru
А касательно кросс-валидации: я верно понимаю, что после тренировки модели я применяю кросс-валидацию, и после этого получаю результаты работы алгоритма через обычный .predict?
источник

SK

Stanislav Kirillov in catboost_ru
catboost.Pool - это хранилище либо сырых данных (при загрузке из файла или из стандартных питоновских списков), либо обертка над pandas(numpy) массивами, если структура в памяти подходит
источник

SZ

Sasha Zhu in catboost_ru
Stanislav Kirillov
catboost.Pool - это хранилище либо сырых данных (при загрузке из файла или из стандартных питоновских списков), либо обертка над pandas(numpy) массивами, если структура в памяти подходит
Ага, так понятнее, спасибо
источник

MK

Maxim Khrisanfov in catboost_ru
Sasha Zhu
А касательно кросс-валидации: я верно понимаю, что после тренировки модели я применяю кросс-валидацию, и после этого получаю результаты работы алгоритма через обычный .predict?
не так, так как ты говоришь работает в sklearn
catboost просто показывает метрику при кросс валидации, а ты смотришь какую итерацию выбрать, модель потом снова придется обучать на всех данных до выбранной итерации
источник

SZ

Sasha Zhu in catboost_ru
Maxim Khrisanfov
не так, так как ты говоришь работает в sklearn
catboost просто показывает метрику при кросс валидации, а ты смотришь какую итерацию выбрать, модель потом снова придется обучать на всех данных до выбранной итерации
О, вот оно что! Спасибо большое
источник

SZ

Sasha Zhu in catboost_ru
pool = Pool(X_train, y_train)
params = {'iterations': 900,
         'depth': 14,
         'loss_function': 'RMSE',
         'verbose': False}
scores = cv(pool, params)

TypeError: Cannot convert 'b'2697143FR'' to float

— а как прокинуть катфичи в cv?
источник

MK

Maxim Khrisanfov in catboost_ru
X_train это pandas dataframe?
источник

SZ

Sasha Zhu in catboost_ru
да
источник

MK

Maxim Khrisanfov in catboost_ru
поставь тип category для этих фич
X_train['feature'] = X_train['feature'].astype('category')
еще можно в Pool передать индексы категориальных фич
источник

SZ

Sasha Zhu in catboost_ru
после train_test_split
источник

SZ

Sasha Zhu in catboost_ru
попробую сейчас
источник

MK

Maxim Khrisanfov in catboost_ru
> еще можно в Pool передать индексы категориальных фич
это даже вроде обязательно но точно не помню
источник

MK

Maxim Khrisanfov in catboost_ru
тогда наверное X_train['feature'] = X_train['feature'].astype('category') не обязательно)
источник

SZ

Sasha Zhu in catboost_ru
сейчас в пул попробую передать
источник