Size: a a a

2020 May 12

А

Антоний in catboost_ru
Hello Everyone
источник

А

Антоний in catboost_ru
Anna Veronika Dorogush
Мы ищем в команду ML тулзов Яндекса (CatBoost как раз мы делаем в этой команде) менеджера:
https://yandex.ru/jobs/vacancies/proj_man/pm_ml_tools/.

Мы ищем человека, который:
- Любит и знает ML
- Хочет и умеет общаться с людьми, выступать, писать посты, ездить на конференции по машинном обучению.

Основными задачами менеджера являются:
- Продвижение наших мл инструментов в мире.
- Построение стратегии развития мл инструментов.
- Развитие платформы рекомендаций Яндекса, а также все остальных библиотек машинного обучения, которые у нас используются.

Для успешной работы будет необходимо понимать, как работают все наши инструменты, а также кто и как их использует.

Москва, 150-300к gross
Отзывайтесь на вакансию, мы вас ждем!
Who is тулзы?)
источник

SK

Stanislav Kirillov in catboost_ru
Это мы
источник

SK

Stanislav Kirillov in catboost_ru
Просто внутри яндекса мы разрабатываем не только катбуст, но и еще набор инстурментов для ML
источник

А

Антоний in catboost_ru
Ээ на Русский
источник

А

Антоний in catboost_ru
Из чего слово произошло?
источник

А

Антоний in catboost_ru
Tools¿
источник

А

Антоний in catboost_ru
Тулзы)
источник

ВЯ

Виталий Ястреб... in catboost_ru
Инструменты
источник

VK

Vladimir Kukushkin in catboost_ru
Anna Veronika Dorogush
Ту проблему пофиксили, у тебя видимо какая-то похожая. Сделай, пожалуйста, issue с примером для воспроизведения, посмотрим
У меня не было доступа к окружению, на котором баг воспроизводился. Но теперь сумел воспроизвести на другой. В общем, проблема появляется, когда обучаю модель с
loss_function="YetiRankPairwise"
и
task_type="GPU"
. Тогда при расчёте shap_values вылезает
CatBoostError: catboost/libs/fstr/util.cpp:102: Cannot calc shap values, model contains non zero approx for zero-weight leaf
. На CPU всё нормально считается. Заводить issue?
источник

AD

Anna Veronika Dorogu... in catboost_ru
вроде пофиксили это, можно собрать последнюю версию кода и проверить
источник

DU

Daniil Udimov in catboost_ru
Ivan Lyzhin
Укажи дополнительно eval_metric='Rmse' например
Теперь другая ошибка. То есть я беру RmseObjective из документации.

model = CatBoostRegressor(loss_function=RmseObjective, eval_metric='RMSE')
model.fit(X=X, y=y)


Получаю ошибку:
CatBoostError: catboost/python-package/catboost/helpers.cpp:41: Traceback (most recent call last):
 File "_catboost.pyx", line 1803, in _catboost._ObjectiveCalcDersRange
 File "<ipython-input-9-33c6e5bff051>", line 3, in calc_ders_range
   assert len(approxes) == len(targets)
TypeError: object of type 'NoneType' has no len()


То есть там вместо targets почему-то передалось в этот метод None.
источник

AD

Anna Veronika Dorogu... in catboost_ru
Daniil Udimov
Теперь другая ошибка. То есть я беру RmseObjective из документации.

model = CatBoostRegressor(loss_function=RmseObjective, eval_metric='RMSE')
model.fit(X=X, y=y)


Получаю ошибку:
CatBoostError: catboost/python-package/catboost/helpers.cpp:41: Traceback (most recent call last):
 File "_catboost.pyx", line 1803, in _catboost._ObjectiveCalcDersRange
 File "<ipython-input-9-33c6e5bff051>", line 3, in calc_ders_range
   assert len(approxes) == len(targets)
TypeError: object of type 'NoneType' has no len()


То есть там вместо targets почему-то передалось в этот метод None.
сделай, пожалуйста, issue на гитхабе, дальше там будем обсуждать
источник

OT

Oscar Tempter in catboost_ru
а катбуст нормально работает с dask ?
источник

VK

Vladimir Kukushkin in catboost_ru
Anna Veronika Dorogush
вроде пофиксили это, можно собрать последнюю версию кода и проверить
я же правильно понимаю, что под "собрать" подразумевается собрать из последних исходников, как тут написано? https://catboost.ai/docs/installation/python-installation-method-build-from-source-linux-macos.html

собрал, проверил, всё равно воспроизводится.
источник

AD

Anna Veronika Dorogu... in catboost_ru
тогда нужно сделать issue, да
источник

A

Algorc in catboost_ru
Vladimir Kukushkin
я же правильно понимаю, что под "собрать" подразумевается собрать из последних исходников, как тут написано? https://catboost.ai/docs/installation/python-installation-method-build-from-source-linux-macos.html

собрал, проверил, всё равно воспроизводится.
Владимир, а вы завели?
Потому что у меня тоже воспроизводится.
Но у меня CPU + loss_function='Quantile:alpha=0.6',
источник

VK

Vladimir Kukushkin in catboost_ru
Algorc
Владимир, а вы завели?
Потому что у меня тоже воспроизводится.
Но у меня CPU + loss_function='Quantile:alpha=0.6',
Нет ещё. Вот сейчас сажусь только писать.
источник

A

Algorc in catboost_ru
Vladimir Kukushkin
Нет ещё. Вот сейчас сажусь только писать.
если что, у меня это при вызове
.get_feature_importance(train_cb, type='ShapValues')
у обученной модели такой stack trace
источник

VK

Vladimir Kukushkin in catboost_ru
Algorc
Владимир, а вы завели?
Потому что у меня тоже воспроизводится.
Но у меня CPU + loss_function='Quantile:alpha=0.6',
источник