Телеграмм чат группы catboost_ru страница 92

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

catboost_ru

553 membersпожаловаться на группу

1
«
…
‹
87
88
89
90
91
92
93
›
…
»

2019 April 11

VS

Vasily Suvorov in catboost_ru

Подскажите как из кросс-валидации взять модель для дальнейшего предсказания?
То есть мы получаем лучшее разбиение и как её вытащить уже для обучения?

use_best_model, при чем если eval_set есть, параметр по умолчанию True

источник

14:49пожаловаться #1

IP

Igor Petrov in catboost_ru

use_best_model, при чем если eval_set есть, параметр по умолчанию True

То есть датасет всё равно вручную делить, нельзя чтоб во время обучения разбивался на фолды?

источник

14:51пожаловаться #2

VS

Vasily Suvorov in catboost_ru

То есть датасет всё равно вручную делить, нельзя чтоб во время обучения разбивался на фолды?

можно использовать https://catboost.ai/docs/concepts/python-reference_cv.html

источник

14:53пожаловаться #3

IP

Igor Petrov in catboost_ru

можно использовать https://catboost.ai/docs/concepts/python-reference_cv.html

Так я про это и в начале спросил)) Это только валидирует, но для обучение как вытащить не знаю

источник

14:54пожаловаться #4

VS

Vasily Suvorov in catboost_ru

Так я про это и в начале спросил)) Это только валидирует, но для обучение как вытащить не знаю

наверное, для предсказания, а не обучения. если сразу несколько, то вероятно только самостоятельно зафиксировав параметры где лучшее среднее и Std, как тут работает use_best_model не раскрывается

источник

14:59пожаловаться #5

IP

Igor Petrov in catboost_ru

наверное, для предсказания, а не обучения. если сразу несколько, то вероятно только самостоятельно зафиксировав параметры где лучшее среднее и Std, как тут работает use_best_model не раскрывается

Спасибо! Думал существуют методы сделать проще

источник

15:00пожаловаться #6

AK

Alexander Khovanskiy in catboost_ru

text_clf = Pipeline([
('tfidf', TfidfVectorizer()),
('clf', RandomForestClassifier(n_estimators=100))
])

model = text_clf.fit(train, train_labels)

подскажите в catboost можно также просто преоброзовыват данные ?

источник

15:18пожаловаться #7

AK

Alexander Khovanskiy in catboost_ru

или нужно руками преоброзовывать и подсовывать в cat_features

источник

15:19пожаловаться #8

AK

Alexander Khovanskiy in catboost_ru

источник

15:20пожаловаться #9

VC

Vad C in catboost_ru

Подскажите как из кросс-валидации взять модель для дальнейшего предсказания?
То есть мы получаем лучшее разбиение и как её вытащить уже для обучения?

Определите по CV лучшую итерацию и сделайте фит модели с этой итерацией

источник

15:50пожаловаться #10

VC

Vad C in catboost_ru

Alexander Khovanskiy

text_clf = Pipeline([
('tfidf', TfidfVectorizer()),
('clf', RandomForestClassifier(n_estimators=100))
])

model = text_clf.fit(train, train_labels)

подскажите в catboost можно также просто преоброзовыват данные ?

на мой взгляд так себе идея использовать деревянные методы для анализа текста, сделайте хотябы свертку SVD для вашего случая

источник

15:54пожаловаться #11

Аa

Андрей amber4eg in catboost_ru

Vad C

на мой взгляд так себе идея использовать деревянные методы для анализа текста, сделайте хотябы свертку SVD для вашего случая

люто плюсую.
лемматизация, TfIdf и линейная модель. Не надо деревья, им глубина понадобится безумная

источник

15:57пожаловаться #12

IP

Igor Petrov in catboost_ru

Vad C

Определите по CV лучшую итерацию и сделайте фит модели с этой итерацией

Так он же еще разделяет выборку. Надо это же разделени и итерацию тогда

источник

16:38пожаловаться #13

AK

Alexander Khovanskiy in catboost_ru

А подскажите в какую сторону копать, RandomForestClassifier accuracy_score=0.994 предсказывает в моем случае лучше, чем GradientBoostingClassifier accuracy_score=0.972, с чем это может быть связано?

источник

19:25пожаловаться #14

K

K-S in catboost_ru

Alexander Khovanskiy

А подскажите в какую сторону копать, RandomForestClassifier accuracy_score=0.994 предсказывает в моем случае лучше, чем GradientBoostingClassifier accuracy_score=0.972, с чем это может быть связано?

Вообще хорошо б теоретическое обоснование услышать в ответе на ваш вопрос.

Штука действительно интересная. Подобная тема уже проскакивала у Дьяконова в статье, посвящённой случайному лесу. Там вроде бы по касательной был затронут вопрос, в 100 ли случаях из 100 бустинг на деревьях обойдёт случайный лес или нет. Кто-то даже приводил в качестве примера какие-то старые соревнования на каггле, где лес действительно выигрывал.

источник

19:34пожаловаться #15

K

K-S in catboost_ru

Alexander Khovanskiy

А подскажите в какую сторону копать, RandomForestClassifier accuracy_score=0.994 предсказывает в моем случае лучше, чем GradientBoostingClassifier accuracy_score=0.972, с чем это может быть связано?

А ошибки в валидации точно нет? Приведённые вами показатели - это ведь результаты по CV, я верно понял?

источник

19:34пожаловаться #16

AK

Alexander Khovanskiy in catboost_ru

Нет это не cv

источник

19:37пожаловаться #17

AK

Alexander Khovanskiy in catboost_ru

Код я скриншотил выше

источник

19:38пожаловаться #18

AK

Alexander Khovanskiy in catboost_ru

Я просто разбил выборку

источник

19:38пожаловаться #19

AK

Alexander Khovanskiy in catboost_ru

Я новичек и сделал все примитивно

источник

19:39пожаловаться #20

1
«
…
‹
87
88
89
90
91
92
93
›
…
»