Size: a a a

2019 April 01

SK

Stanislav Kirillov in catboost_ru
Андрей
ускорило с нача до 35 минут, спасибо. Точность на тесте упала с 0.825933 до 0.823368
можно еще поиграться как раз с rsm и постепенным повышением количества бордеров:)
источник

H

Helen in catboost_ru
Stanislav Kirillov
можно попробовать поднять этот параметр до 100 и посмотреть на скорость
Попробовала до 100 поднять - итог 40 мин, ну не особо быстрее стало (было около часа)
Убрала совсем фичу с 1800 вариантом категории, стало быстрее - 25 мин
Совсем без категорий - 1мин
источник

H

Helen in catboost_ru
Спасибо за советы
источник

SK

Stanislav Kirillov in catboost_ru
Helen
Попробовала до 100 поднять - итог 40 мин, ну не особо быстрее стало (было около часа)
Убрала совсем фичу с 1800 вариантом категории, стало быстрее - 25 мин
Совсем без категорий - 1мин
можешь не убирать ту, что с 1800
источник

SK

Stanislav Kirillov in catboost_ru
просто ограничить сложность комбинаций
источник

SK

Stanislav Kirillov in catboost_ru
max_ctr_complexity
источник

SK

Stanislav Kirillov in catboost_ru
она по умолчанию 4
источник

SK

Stanislav Kirillov in catboost_ru
и еще, поскажи, какую глубину деревьев ты задаешь?
источник

SK

Stanislav Kirillov in catboost_ru
Снижение сложности с 4 до 2-х очень круто сокращает время обучения
источник

H

Helen in catboost_ru
Stanislav Kirillov
и еще, поскажи, какую глубину деревьев ты задаешь?
дефолтную, она 6, вроде, равна
источник

SK

Stanislav Kirillov in catboost_ru
это хорошо
источник

H

Helen in catboost_ru
Stanislav Kirillov
Снижение сложности с 4 до 2-х очень круто сокращает время обучения
круто, попробую, спасибо
источник

SK

Stanislav Kirillov in catboost_ru
не за что :)
источник

А

Андрей in catboost_ru
Stanislav Kirillov
можно еще поиграться как раз с rsm и постепенным повышением количества бордеров:)
CatBoostError: catboost/libs/options/catboost_options.cpp:400: Error: rsm on GPU is supported for pairwise modes only
А что такое «pairwise modes»?
источник

YB

Yury B in catboost_ru
Андрей
CatBoostError: catboost/libs/options/catboost_options.cpp:400: Error: rsm on GPU is supported for pairwise modes only
А что такое «pairwise modes»?
В задачах ранжирования
источник

А

Андрей in catboost_ru
аааа
источник

SK

Stanislav Kirillov in catboost_ru
Да, извини что я не уточнил про это :(
источник

YB

Yury B in catboost_ru
Вообще планируется ли rsm для классификации/регрессии на gpu?
источник
2019 April 02

MK

Maxim Khrisanfov in catboost_ru
После обновления с 12 до 13.1 при создании пула стала появляться ошибка:

KeyError                                  Traceback (most recent call last)
/usr/local/lib/python3.6/dist-packages/pandas/core/indexes/base.py in get_loc(self, key, method, tolerance)
  2656             try:
-> 2657                 return self._engine.get_loc(key)
  2658             except KeyError:

pandas/_libs/index.pyx in pandas._libs.index.IndexEngine.get_loc()

pandas/_libs/index.pyx in pandas._libs.index.IndexEngine.get_loc()

pandas/_libs/hashtable_class_helper.pxi in pandas._libs.hashtable.Int64HashTable.get_item()

pandas/_libs/hashtable_class_helper.pxi in pandas._libs.hashtable.Int64HashTable.get_item()

KeyError: 0


/usr/local/lib/python3.6/dist-packages/catboost/core.py in __init__(self, data, label, cat_features, column_description, pairs, delimiter, has_header, weight, group_id, group_weight, subgroup_id, pairs_weight, baseline, feature_names, thread_count)
   289                         )
   290
--> 291                 self._init(data, label, cat_features, pairs, weight, group_id, group_weight, subgroup_id, pairs_weight, baseline, feature_names)
   292         super(Pool, self).__init__()
   293

/usr/local/lib/python3.6/dist-packages/catboost/core.py in _init(self, data, label, cat_features, pairs, weight, group_id, group_weight, subgroup_id, pairs_weight, baseline, feature_names)
   644         if feature_names is not None:
   645             self._check_feature_names(feature_names, features_count)
--> 646         self._init_pool(data, label, cat_features, pairs, weight, group_id, group_weight, subgroup_id, pairs_weight, baseline, feature_names)
   647
   648

_catboost.pyx in _catboost._PoolBase._init_pool()

_catboost.pyx in _catboost._PoolBase._init_pool()

_catboost.pyx in _catboost._PoolBase._init_features_order_layout_pool()

_catboost.pyx in _catboost._set_features_order_data_pd_data_frame()


из-за чего такое может быть?
источник

IP

Igor Petrov in catboost_ru
Добрый день. Имеется таблица с данным где в некоторых фичах есть пусто значение. Как его правильно в CatBoost обработать? Заменить на nan или взять среднее из результатов?
источник