Size: a a a

2019 April 02

G

Grigory in catboost_ru
я про другое. Про то , что хотелось бы гайд по более-менее осмысленному подбору параметров в зависимости от особенностей датасета, и на примерах.
источник

G

Grigory in catboost_ru
иначе это какая-то чёрная магия + сокровенные знания+ гадание на кофейной гуще рандомом
источник

K

K-S in catboost_ru
Байесовская оптимизация?
источник
2019 April 03

OT

Olga Tsvetkova in catboost_ru
Добрый день!
Подскажите, как можно интерпретировать в предикте RawFormulaVal ? У меня получаются и отрицательные и положительные цифры, в сумме дающие 0. Как посоветуете их привести к вероятностям?
источник

AD

Anna Veronika Dorogush in catboost_ru
если бинарная классификация, то чтобы получить вероятности, нужно применить сигмоиду. Либо в питоне можно передать тип предсказания Probability
источник

OT

Olga Tsvetkova in catboost_ru
Anna Veronika Dorogush
если бинарная классификация, то чтобы получить вероятности, нужно применить сигмоиду. Либо в питоне можно передать тип предсказания Probability
Спасибо!
источник

DB

Dmitry Buslov in catboost_ru
Grigory
@annaveronika предложение уважаемым разработчикам катбуста - нет ли у вас возможности сделать некий гайд с примерами по подбору гиперпараметров? Например, вот некий открытый датасет1, по нему хорошо работают такие-то параметры потому-то, а вот такие - не очень, вот датасет2, тут другая тема, работают такие-то параметры, а вот такие - работают плохо, вот датасет3... ну, вы поняли. Мне кажется, такой гайд был бы очень полезен всем, и сильно поднял бы популярность катбуста. Может, я не совсем в теме, и такой гайд уже есть - прошу кинуть ссылку
+++
источник

DB

Dmitry Buslov in catboost_ru
Я предлагаю в следующем формате - каждый параметр с описанием где он работает лучше и хуже
источник

DB

Dmitry Buslov in catboost_ru
откуда идея его появления
источник

DB

Dmitry Buslov in catboost_ru
просто гиперопт - это "перебор" всего
источник

DB

Dmitry Buslov in catboost_ru
а хотелось бы понимать природу параметра
источник

DB

Dmitry Buslov in catboost_ru
простые, вроде глубины деревьев - и так понятны
источник

DB

Dmitry Buslov in catboost_ru
а вот появление остальных не всегда очевидно
источник

OS

Oleg Shapovalov in catboost_ru
Dmitry Buslov
Я предлагаю в следующем формате - каждый параметр с описанием где он работает лучше и хуже
А вот это смотрели? https://youtu.be/UYDwhuyWYSo
источник

OS

Oleg Shapovalov in catboost_ru
Много что становится понятно
источник

AK

Alexander Khovanskiy in catboost_ru
Добрый день, а может кто прислать пример по работе с текстом в catboost, у меня 66к строк в таблице с колонками: 1 название организации,  2 региональная принадлежность (фед/рег/мун), хотелось бы подсунуть это модели и чтобы при добавления новых организаций он мог предсказывать региональную принадлежность
источник

AK

Alexander Khovanskiy in catboost_ru
Буду очень благодарен, спасибо
источник

Аa

Андрей amber4eg in catboost_ru
А нет ли в планах изменяемого lr? У меня вот задачка, на которой очень бодро заходит lr=0.6, но хотелось бы в какой-то момент начать его уменьшать. Стартовать обучение с lr=0.03 - это на  несколько суток, думаю :(
источник

AD

Anna Veronika Dorogush in catboost_ru
нет, такого в планах нет, потому что на нашем опыте начать с большого лернинг рейта, а потом уменьшить хуже, чем сразу начать с маленького. Если 0.03 слишком долго, можно поставить столько, сколько успеется, но меньше 0.6.
источник

AG

Artyom Gruzdev in catboost_ru
Андрей amber4eg
А нет ли в планах изменяемого lr? У меня вот задачка, на которой очень бодро заходит lr=0.6, но хотелось бы в какой-то момент начать его уменьшать. Стартовать обучение с lr=0.03 - это на  несколько суток, думаю :(
в gbm от h2o есть такая возможность, параметр называется learn_rate_annealing
источник