Телеграмм чат группы catboost

2020 March 06

Аa

Андрей amber4eg in catboost_ru

при создании Pool'а надо было их ещё задать

источник

17:31пожаловаться #1

MK

Maxim Khrisanfov in catboost_ru

в конструктор модели тогда не надо

источник

17:31пожаловаться #2

2020 March 07

SK

Serezha Kovarubias in catboost_ru

Здравствуйте. Допустим, есть выборка из 1000 предикторов, в начале хочу пообучать модель на 500, а потом продолжить обучать ещё на 500. Как это сделать? Идея в том, что в начале хочу использовать предикторы равномерно распределенные по выборке, а потом уже более уникальные.

источник

20:28пожаловаться #3

A

Alex in catboost_ru

Serezha Kovarubias

Здравствуйте. Допустим, есть выборка из 1000 предикторов, в начале хочу пообучать модель на 500, а потом продолжить обучать ещё на 500. Как это сделать? Идея в том, что в начале хочу использовать предикторы равномерно распределенные по выборке, а потом уже более уникальные.

Случаем не в рамках анализа портфеля или скоринга? :)

источник

21:54пожаловаться #4

SK

Serezha Kovarubias in catboost_ru

Временные ряды

источник

22:16пожаловаться #5

2020 March 08

AK

Andrei Khropov in catboost_ru

Serezha Kovarubias

Здравствуйте. Допустим, есть выборка из 1000 предикторов, в начале хочу пообучать модель на 500, а потом продолжить обучать ещё на 500. Как это сделать? Идея в том, что в начале хочу использовать предикторы равномерно распределенные по выборке, а потом уже более уникальные.

под "предикторами" имеются ввиду индивидуальные деревья в модели?

источник

02:12пожаловаться #6

AD

Anna Veronika Dorogush in catboost_ru

Serezha Kovarubias

Здравствуйте. Допустим, есть выборка из 1000 предикторов, в начале хочу пообучать модель на 500, а потом продолжить обучать ещё на 500. Как это сделать? Идея в том, что в начале хочу использовать предикторы равномерно распределенные по выборке, а потом уже более уникальные.

Технически это сделать можно: сначала обучается модель на первой половине фичей, потом при помощи нее делается предсказание для всей выборки, оно кладется в baseline, и новое обучение делается из бейзлайна (примеры см в документации). Но работать будет скорее всего хуже, чем если на всем обучиться.

источник

03:08пожаловаться #7

2020 March 09

A

Alex in catboost_ru

Коллеги а кто нибудь применяет катбуст для анализа кредитного портфеля?

источник

17:32пожаловаться #8

FT

Fedor Tarasov in catboost_ru

Я применяю

источник

18:06пожаловаться #9

2020 March 10

SK

Serezha Kovarubias in catboost_ru

Anna Veronika Dorogush

Технически это сделать можно: сначала обучается модель на первой половине фичей, потом при помощи нее делается предсказание для всей выборки, оно кладется в baseline, и новое обучение делается из бейзлайна (примеры см в документации). Но работать будет скорее всего хуже, чем если на всем обучиться.

Спасибо за ответ! Возможность обнадеживает! Однако, я совершенно не могу понять, как это сделать из инструкции - нет примеров. Мне нужно это сделать для версии с командной строкой, можете как то детальней показать по шагам, что делать?

источник

19:23пожаловаться #10

AD

Anna Veronika Dorogush in catboost_ru

Serezha Kovarubias

Спасибо за ответ! Возможность обнадеживает! Однако, я совершенно не могу понять, как это сделать из инструкции - нет примеров. Мне нужно это сделать для версии с командной строкой, можете как то детальней показать по шагам, что делать?

https://catboost.ai/docs/concepts/python-usages-examples.html#baseline - вот тут пример, как использовать бейзлайн из питона

catboost.ai

Usage examples - CatBoost. Documentation

Train a classification model on GPU:from catboost import CatBoostClassifier train_data = [[0, 3], [4, 1], [8, 1], [9, 1]] train_labels = [0, 0, 1, 1] model = CatBoostClassifier(iterations=1000, task_type="GPU", devices='0:1') model.fit(train_data, train_labels, verbose=False)

источник

19:26пожаловаться #11

AG

Andrew Grigorev in catboost_ru

А ведь не всегда файнтюнинг это только другой датасет. Часто и семантика вывода модели должна измениться. Кажется что обычно в таких случаях catboost уже поверх какой-то другой модели идет, поверх каких-то эмбеддингов например. Интересно есть ли случаи когда целесообразно наоборот - снизу предобученная модель gradient boosting, а поверх что-то ещё?

источник

21:39пожаловаться #12

p

pin in catboost_ru

Andrew Grigorev

А ведь не всегда файнтюнинг это только другой датасет. Часто и семантика вывода модели должна измениться. Кажется что обычно в таких случаях catboost уже поверх какой-то другой модели идет, поверх каких-то эмбеддингов например. Интересно есть ли случаи когда целесообразно наоборот - снизу предобученная модель gradient boosting, а поверх что-то ещё?

А есть примеры описанного?

источник

21:40пожаловаться #13

AG

Andrew Grigorev in catboost_ru

catboost поверх эмбеддингов?

источник

21:41пожаловаться #14

2020 March 11

p

pin in catboost_ru

Да

источник

07:31пожаловаться #15

ВС

Владислав Сафоничев in catboost_ru

Друзья, всем привет, хотел бы попробовать бибилотечку для мультиклассификации текстов, в документации нашел только про токензицию и словари, примеров с тестовыми данными я не нашел. Собственно вопрос: нужен ли какой-то препроцессинг для текстов (кроме токенизации, естественнно) и доступна ли мультиклассификация (полистал чат, вроде кто-то писал, что пока только бинарная классификация для текста доступна)

источник

10:59пожаловаться #16

AD

Anna Veronika Dorogush in catboost_ru

Владислав Сафоничев

Друзья, всем привет, хотел бы попробовать бибилотечку для мультиклассификации текстов, в документации нашел только про токензицию и словари, примеров с тестовыми данными я не нашел. Собственно вопрос: нужен ли какой-то препроцессинг для текстов (кроме токенизации, естественнно) и доступна ли мультиклассификация (полистал чат, вроде кто-то писал, что пока только бинарная классификация для текста доступна)

Доступна, в папке с туториалами есть пример

источник

11:25пожаловаться #17

AD

Anna Veronika Dorogush in catboost_ru

https://github.com/catboost/tutorials/tree/master/text_features

GitHub

catboost/tutorials

CatBoost tutorials repository. Contribute to catboost/tutorials development by creating an account on GitHub.