Телеграмм чат группы catboost_ru страница 453

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

catboost_ru

1026 membersпожаловаться на группу

2021 June 12

TG

T G in catboost_ru

Я и не смог воспроизвести ошибку при текущей версии , пытался понять что делает пул и какие параметры могли быть установлены автоматически не так как в предыдущий раз...

источник

21:31пожаловаться #1

2021 June 13

TG

T G in catboost_ru

Здравствуйте, в продолжении темы использования свободной Ram в процессе обучения модели...

На рабочем ПК с ограниченным числом ресурсов свободной ram~ 20gb пытаюсь отработать часть данных для подбора гиперпараметров и их использовании на сервере с объемом датасета x20... used_ram_limit плохо работает... Мб я его неправильно задал?
Датасет 98фичей 1млн строк, 70%катег. Весит пару сотен Mb, обучение съедает 20гб свободной оперативы, ядро выбивает каждые 800 итераций...

Уменьшение итераций и увеличение learning_rate приводит к переобучению примерно на 100ой итерации, в итоге accuracy 0.65 Vs 0.87...

Есть примеры итеративного обучения и дообучения модели или что можно оптимизировать в параметрах обучения модели?

источник

14:18пожаловаться #2

TG

T G in catboost_ru

источник

14:18пожаловаться #3

TG

T G in catboost_ru

источник

14:18пожаловаться #4

SK

Stanislav Kirillov in catboost_ru

Попробуйте max_ctr_complexity=3 или даже max_ctr_complexity=2

источник

14:19пожаловаться #5

TG

T G in catboost_ru

Спасибо, а used_ram_limit правильно задал?

источник

14:22пожаловаться #6

SK

Stanislav Kirillov in catboost_ru

Да, то что не сработало - больше похоже на какую-то нашу багу

источник

14:23пожаловаться #7

TG

T G in catboost_ru

А какую функцию выполняет pool, если квантизацию не делал, а объявил только x_train, label и catfutures ?

источник

17:24пожаловаться #8

L

LS in catboost_ru

Попробуй tsv файл сделать и загрузить его через пул. У меня файл размером 75гиг train и 27гиг validation, загруженные через пул вместе с cd файлом, занимают около 55 гигов памяти. Но у тебя большое количество cat features, возможно ещё из-за этого.

источник

18:11пожаловаться #9

2021 June 17

OA

Oleg Antonovich in catboost_ru

Товарищи, а по каким параметрам наиболее разумно гридсёрчиться в общем случае по классифаеру, что обычно даёт профит?
Сейчас перебираю learning rate, depth, l2 leaf reg. Думаю что-то добавить, глаза разбегаются.

источник

11:02пожаловаться #10

IL

Ivan Lyzhin in catboost_ru

Вот здесь описаны основные параметры, которые имеет смысл подбирать https://catboost.ai/docs/concepts/parameter-tuning.html

Parameter tuning - CatBoost. Documentation

Do not use one-hot encoding during preprocessing. This affects both the training speed and the resulting quality.

источник

11:05пожаловаться #11

OA

Oleg Antonovich in catboost_ru

Спасибо!

источник

11:05пожаловаться #12

II

Ilia Iagupov in catboost_ru

Добрый день, подскажите пожалуйста, как CatBoostRegressor считает конечные результаты?
Я написал небольшой скрипт, чтобы визуализировать дерево, построенное катбустом (model.plot_tree). Но значения в листьях отличаются от прогнозируемых значений (model.predict). Также я нашёл, что катбуст пересчитывает эти значения по формуле RawFormulaVal, но я нигде не могу найти эту формулу.

Код:
import pandas as pd
from catboost import CatBoostRegressor

features = pd.DataFrame({'feature_1':[1,2]})
target = pd.DataFrame({'c':[3,4]})

model_tmp = CatBoostRegressor(iterations=1, depth=1, verbose=0)
model_tmp.fit(features, target)

print('Result:', model_tmp.predict([1]))

источник

14:11пожаловаться #13

II

Ilia Iagupov in catboost_ru

и дерево:

источник

14:12пожаловаться #14

II

Ilia Iagupov in catboost_ru

Предсказанное значение = 3.4375

источник

14:12пожаловаться #15

IL

Ivan Lyzhin in catboost_ru

Привет! Все дело в boost_from_average, который выставлен по умолчанию для RMSE. Обучение начинается не с 0, а со среднего таргета, то есть с 3.5 в твоем примере. Этот начальный отступ можно получить с помощью
model_tmp.get_scale_and_bias()

источник

14:46пожаловаться #16

II

Ilia Iagupov in catboost_ru

точно! всё понятно, если посмотреть на эти значения!
спасибо большое!

источник

14:50пожаловаться #17

VS

Vitaly S in catboost_ru

Добрый день, умирает ядро при использовании GPU (прямо на примере из документации https://catboost.ai/docs/features/training-on-gpu.html). Версии вроде соответствуют требованиям:
catboost 0.26
Windows 10 Pro 20H2 (10.0.19042.782)
NVIDIA GeForce GTX 1650 Ti
NVIDIA-SMI 451.82
Driver Version: 451.82
CUDA Version: 11.0

При этом tensorflow с GPU работает исправно. Как я могу устранить проблему? Буду рад любым идеям.

Training on GPU - CatBoost. Documentation

CatBoost supports training on GPUs.

источник

18:55пожаловаться #18

VS

Vitaly S in catboost_ru

Забыл написать, на версии 0.25.1 работает исправно

источник

20:58пожаловаться #19

SK

Stanislav Kirillov in catboost_ru

Привет, я дебажу это прям сейчас)

источник

21:01пожаловаться #20