Size: a a a

2018 November 01

PB

Pavel Baidaus in catboost_ru
Все вопрос снят X.dtypes надо указывать первоначальную выборку Train.dtypes а не после разделения на Х и у
источник

V

Viktor in catboost_ru
источник

AD

Anna Veronika Dorogush in catboost_ru
источник

V

Viktor in catboost_ru
спс
источник

AD

Anna Veronika Dorogush in catboost_ru
мы в туториалах поменяли структуру и написали побольше комментов, чтобы было проще ориентироваться
источник

AD

Anna Veronika Dorogush in catboost_ru
некоторые ссылки сломались :(
источник

V

Viktor in catboost_ru
отлично, как раз хочу посмотреть примеры где используются категориальные признаки, а то были проблемы с этим
источник

DC

Danya Chepenko in catboost_ru
Привет, а кто-нибудь использовал связку catboost + dask/spark? Подскажите, как это правильно сделать
источник
2018 November 02

V

Viktor in catboost_ru
Danya Chepenko
Привет, а кто-нибудь использовал связку catboost + dask/spark? Подскажите, как это правильно сделать
а ты как хочешь dask использовать? а то он как в numpy, pandas & sklearn
источник
2018 November 08

AG

Alexey Gorodilov in catboost_ru
Добрый Вечер!

Как вы наверно знаете, сейчас Яндекс.Облако (https://cloud.yandex.ru/) можно использовать по приглашениям. Мы хотели бы собрать больше фидбека по такому продукту, как Data Science Virtual Machine  (https://cloud.yandex.ru/docs/compute/operations/dsvm/ ).
Пришлите в группу ниже, свои данные в формате:
имя TAB email TAB telegram-username
до вечера воскресенья и во вторник вы получите письмо с промокодом Яндекс.Облака на 4000 руб. Очень хочется, чтобы вы потратили его на использование DSVM и прислали свой фидбек.

Фидбек можно писать в группу https://t.me/joinchat/BCi3Ig1BOHrlxUmqNO7Alw
источник
2018 November 14

P

Pavel in catboost_ru
Alexey Gorodilov
Добрый Вечер!

Как вы наверно знаете, сейчас Яндекс.Облако (https://cloud.yandex.ru/) можно использовать по приглашениям. Мы хотели бы собрать больше фидбека по такому продукту, как Data Science Virtual Machine  (https://cloud.yandex.ru/docs/compute/operations/dsvm/ ).
Пришлите в группу ниже, свои данные в формате:
имя TAB email TAB telegram-username
до вечера воскресенья и во вторник вы получите письмо с промокодом Яндекс.Облака на 4000 руб. Очень хочется, чтобы вы потратили его на использование DSVM и прислали свой фидбек.

Фидбек можно писать в группу https://t.me/joinchat/BCi3Ig1BOHrlxUmqNO7Alw
Добрый день.
Есть ли еще возможность подачи заявки по данной акции?
источник
2018 November 18

SO

Some One in catboost_ru
Anna Veronika Dorogush
сейчас кросс-валидация только случайно бьет данные. И пока нельзя свои фолды передавать. Скоро сделаем, чтоб свои можно было
Очень странно, что это реализовано таким образом, будем ждать, спасибо!
источник

MK

Maxim Khrisanfov in catboost_ru
Добрый день! Вопрос к команде CatBoost.
Функция get_feature_importance(data=Pool(X, cat_features=[...], fstr_type='ShapValues') работает очень медленно, всего лишь для 6 наблюдений выполняется 7 секунд. Так и должно быть?
Немного информации о моих данных
Наблюдений: 6
Всего признаков: 52
Категориальных признаков: 5
Количество деревьев в модели: 2867
источник

MK

Maxim Khrisanfov in catboost_ru
Processing trees...
128/2867 trees processed  passed time: 283ms  remaining time: 6.06s sec
256/2867 trees processed  passed time: 617ms  remaining time: 6.29s sec
384/2867 trees processed  passed time: 964ms  remaining time: 6.23s sec
512/2867 trees processed  passed time: 1.45s  remaining time: 6.69s sec
640/2867 trees processed  passed time: 1.91s  remaining time: 6.64s sec
.....
2688/2867 trees processed  passed time: 7.64s  remaining time: 509ms sec
2816/2867 trees processed  passed time: 7.99s  remaining time: 145ms sec
2867/2867 trees processed  passed time: 8.12s  remaining time: 0us sec
Processing documents...
6/6 documents processed  passed time: 2.84ms  remaining time: 0us sec
источник
2018 November 20

OT

Oscar Tempter in catboost_ru
Всем привет. Кто нибудь может подсказать как лучше поступить: мне необходимо создать бинарный классификатор. В датасете для обучения полно категориальных признаков, но проблема в том что со временем данные будут добавляться и мне необходимо будет переобучать модель заново. Помимо этого может получиться так, что при подаче нового объекта для классификации в одной из фичей может появиться новая категория, я правильно понимаю что catboost внутри автоматически выполняет бинарное кодирование категориальных признаков, и при подаче нового объекта с новой категорией в фиче он может не "съесть" этот объект? или же он производит реиндексацию при появлении новых категорий?
источник

OT

Oscar Tempter in catboost_ru
мне важно это знать тк мне либо заранее делать самому бинарное кодирование и переиндексацию, либо можно положиться на catboost?
источник

AG

Artyom Gruzdev in catboost_ru
Catboost выполняет преобразование категориалок в количественные, как пример, можно здесь посмотреть
источник

VE

Vasily Ershov in catboost_ru
Oscar Tempter
Всем привет. Кто нибудь может подсказать как лучше поступить: мне необходимо создать бинарный классификатор. В датасете для обучения полно категориальных признаков, но проблема в том что со временем данные будут добавляться и мне необходимо будет переобучать модель заново. Помимо этого может получиться так, что при подаче нового объекта для классификации в одной из фичей может появиться новая категория, я правильно понимаю что catboost внутри автоматически выполняет бинарное кодирование категориальных признаков, и при подаче нового объекта с новой категорией в фиче он может не "съесть" этот объект? или же он производит реиндексацию при появлении новых категорий?
привет, все должно работать автоматически
источник

AG

Artyom Gruzdev in catboost_ru
источник

OT

Oscar Tempter in catboost_ru
Artyom Gruzdev
Catboost выполняет преобразование категориалок в количественные, как пример, можно здесь посмотреть
это понятно, но что если появится новый объект в котором в одной из фичей появится новая категория, он сможет выполнить по ней предсказание?
источник