Size: a a a

2020 March 06

Аa

Андрей amber4eg in catboost_ru
при создании Pool'а надо было их ещё задать
источник

MK

Maxim Khrisanfov in catboost_ru
в конструктор модели тогда не надо
источник
2020 March 07

SK

Serezha Kovarubias in catboost_ru
Здравствуйте. Допустим, есть выборка из 1000 предикторов, в начале хочу пообучать модель на 500, а потом продолжить обучать ещё на 500. Как это сделать? Идея в том, что в начале хочу использовать предикторы равномерно распределенные по выборке, а потом уже более уникальные.
источник

A

Alex in catboost_ru
Serezha Kovarubias
Здравствуйте. Допустим, есть выборка из 1000 предикторов, в начале хочу пообучать модель на 500, а потом продолжить обучать ещё на 500. Как это сделать? Идея в том, что в начале хочу использовать предикторы равномерно распределенные по выборке, а потом уже более уникальные.
Случаем не в рамках анализа портфеля или скоринга? :)
источник

SK

Serezha Kovarubias in catboost_ru
Временные ряды
источник
2020 March 08

AK

Andrei Khropov in catboost_ru
Serezha Kovarubias
Здравствуйте. Допустим, есть выборка из 1000 предикторов, в начале хочу пообучать модель на 500, а потом продолжить обучать ещё на 500. Как это сделать? Идея в том, что в начале хочу использовать предикторы равномерно распределенные по выборке, а потом уже более уникальные.
под "предикторами" имеются ввиду индивидуальные деревья в модели?
источник

AD

Anna Veronika Dorogush in catboost_ru
Serezha Kovarubias
Здравствуйте. Допустим, есть выборка из 1000 предикторов, в начале хочу пообучать модель на 500, а потом продолжить обучать ещё на 500. Как это сделать? Идея в том, что в начале хочу использовать предикторы равномерно распределенные по выборке, а потом уже более уникальные.
Технически это сделать можно: сначала обучается модель на первой половине фичей, потом при помощи нее делается предсказание для всей выборки, оно кладется в baseline, и новое обучение делается из бейзлайна (примеры см в документации). Но работать будет скорее всего хуже, чем если на всем обучиться.
источник
2020 March 09

A

Alex in catboost_ru
Коллеги а кто нибудь применяет катбуст для анализа кредитного портфеля?
источник

FT

Fedor Tarasov in catboost_ru
Я применяю
источник
2020 March 10

SK

Serezha Kovarubias in catboost_ru
Anna Veronika Dorogush
Технически это сделать можно: сначала обучается модель на первой половине фичей, потом при помощи нее делается предсказание для всей выборки, оно кладется в baseline, и новое обучение делается из бейзлайна (примеры см в документации). Но работать будет скорее всего хуже, чем если на всем обучиться.
Спасибо за ответ! Возможность обнадеживает! Однако, я совершенно не могу понять, как это сделать из инструкции - нет примеров. Мне нужно это сделать для версии с командной строкой, можете как то детальней показать по шагам, что делать?
источник

AD

Anna Veronika Dorogush in catboost_ru
Serezha Kovarubias
Спасибо за ответ! Возможность обнадеживает! Однако, я совершенно не могу понять, как это сделать из инструкции - нет примеров. Мне нужно это сделать для версии с командной строкой, можете как то детальней показать по шагам, что делать?
https://catboost.ai/docs/concepts/python-usages-examples.html#baseline - вот тут пример, как использовать бейзлайн из питона
источник

AG

Andrew Grigorev in catboost_ru
А ведь не всегда файнтюнинг это только другой датасет. Часто и семантика вывода модели должна измениться. Кажется что обычно в таких случаях catboost уже поверх какой-то другой модели идет, поверх каких-то эмбеддингов например. Интересно есть ли случаи когда целесообразно наоборот - снизу предобученная модель gradient boosting, а поверх что-то ещё?
источник

p

pin in catboost_ru
Andrew Grigorev
А ведь не всегда файнтюнинг это только другой датасет. Часто и семантика вывода модели должна измениться. Кажется что обычно в таких случаях catboost уже поверх какой-то другой модели идет, поверх каких-то эмбеддингов например. Интересно есть ли случаи когда целесообразно наоборот - снизу предобученная модель gradient boosting, а поверх что-то ещё?
А есть примеры описанного?
источник

AG

Andrew Grigorev in catboost_ru
catboost поверх эмбеддингов?
источник
2020 March 11

p

pin in catboost_ru
Да
источник

ВС

Владислав Сафоничев in catboost_ru
Друзья, всем привет, хотел бы попробовать бибилотечку для мультиклассификации текстов, в документации нашел только про токензицию и словари, примеров с тестовыми данными я не нашел. Собственно вопрос: нужен ли какой-то препроцессинг для текстов (кроме токенизации, естественнно) и доступна ли мультиклассификация (полистал чат, вроде кто-то писал, что пока только бинарная классификация для текста доступна)
источник

AD

Anna Veronika Dorogush in catboost_ru
Владислав Сафоничев
Друзья, всем привет, хотел бы попробовать бибилотечку для мультиклассификации текстов, в документации нашел только про токензицию и словари, примеров с тестовыми данными я не нашел. Собственно вопрос: нужен ли какой-то препроцессинг для текстов (кроме токенизации, естественнно) и доступна ли мультиклассификация (полистал чат, вроде кто-то писал, что пока только бинарная классификация для текста доступна)
Доступна, в папке с туториалами есть пример
источник

AD

Anna Veronika Dorogush in catboost_ru
источник

ВС

Владислав Сафоничев in catboost_ru
источник

ВС

Владислав Сафоничев in catboost_ru
Anna Veronika Dorogush
Доступна, в папке с туториалами есть пример
спасибо, большое!
источник