Телеграмм чат группы catboost_ru страница 451

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

catboost_ru

1028 membersпожаловаться на группу

2021 June 11

RY

Ruslan515 Y in catboost_ru

подскажи пж - есть ли готовая либа для многоклассовой классификации текста? в catboost удобно - можно для ускорения пропустить этап векторизации текста

источник

15:30пожаловаться #1

D

Dima in catboost_ru

бейзлайн вроде как tf-idf + svm/logreg и вроде быстро работает и качество достаточно неплохое, а так использовать bert)
не часто работаю с текстом, мб тебе кто-то подскажет более релевантную инфу

источник

15:34пожаловаться #2

RY

Ruslan515 Y in catboost_ru

ок. спасибо!

источник

15:34пожаловаться #3

D

Dima in catboost_ru

https://t.me/natural_language_processing
тут точно подскажут)

Natural Language Processing

NLP in English @nlp_eng

Чат пользователей Natasha natasha.github.io. Русскоязычная площадка про NLP: QA, новости, мероприятия, вакансии t.me/natural_language_processing/25846.

Саморегулируемое сообщество, работает @banofbot

Админы @dveselov, @alexkuk

источник

15:35пожаловаться #4

A

Alexander V in catboost_ru

Есть вопрос как ускорить обучение со своим custom_loss @kizill
* Если использовать стандартный лосс, то время на итерацию примерно 0.1 сек
* Если использую свой лосс, тогда время итерации увеличивается в 50 раз: до 5-7 секунд. Причём бОльшая часть времени тратится где-то внутри кэтбуста, мой лосс считается очень быстро.
* При этом lightgbm работает гораздо быстрее с тем же лоссом.

Думается, что что-то не так происходит.
https://pastebin.com/Liwhr33P -- вот тут минимальный пример

import catboost as cbimport lightgbm as lgfrom sklearn.datasets import mak - Pastebin.com

Pastebin.com is the number one paste tool since 2002. Pastebin is a website where you can store text online for a set period of time.

источник

15:44пожаловаться #5

SK

Stanislav Kirillov in catboost_ru

А пробуешь на 0.26?

источник

16:09пожаловаться #6

SK

Stanislav Kirillov in catboost_ru

Попробуйте установить numba

источник

16:11пожаловаться #7

A

Alexander V in catboost_ru

сейчас попробую 0.26 + numba

источник

16:13пожаловаться #8

A

Alexander V in catboost_ru

Отлично. Гораздо быстрее и теперь почти сравнимо по скорости со стандартным лосом! Спасибо

Поизмерял:
* самый большой эффект дал апдейт 0.25 -> 0.26
* эффект от numba тоже есть, но небольшой

источник

16:25пожаловаться #9

SK

Stanislav Kirillov in catboost_ru

😻

источник

16:27пожаловаться #10

SK

Stanislav Kirillov in catboost_ru

Класс!

источник

16:27пожаловаться #11

A

Alexander V in catboost_ru

Ещё важный момент для ускорения catboost vs lightgbm:

X = np.array(X, order="F")

Без этого ужасно тормозит catboost почему-то.

источник

16:39пожаловаться #12

A

Alexander V in catboost_ru

Думаю вы можете проверять тип паддинга массива на входе и хотя бы warning писать. Ибо вообще не очевидно в чём проблема. @kizill

источник

16:42пожаловаться #13

SK

Stanislav Kirillov in catboost_ru

В целом такой совет правда имеет смысл писать в лог

источник

16:51пожаловаться #14

SK

Stanislav Kirillov in catboost_ru

Но в целом разница по скорости не должна быть катастрофической

источник

16:52пожаловаться #15

A

Alexander V in catboost_ru

import catboost as cb
from sklearn.datasets import make_regression

X, Y = make_regression(n_samples=500_000, n_features=100)

reg = cb.CatBoostRegressor(max_depth=6, n_estimators=10, learning_rate=0.1)

%timeit -r1 -n1 reg.fit(X, Y)

X = np.array(X, order="F")

%timeit -r1 -n1 reg.fit(X, Y)

источник

16:57пожаловаться #16

A

Alexander V in catboost_ru

Да, действительно, время самого обучения примерно такое. Но подготовка перед обучением (квантизация?) существенно дольше.

источник

16:59пожаловаться #17

SK

Stanislav Kirillov in catboost_ru

это время на python=>c++ передачу

источник

16:59пожаловаться #18

A

Alexander V in catboost_ru

у меня тут 16s vs 1s. Хотя массив сконвертировать можно за 0.3s

источник

17:01пожаловаться #19

W(

WaitForMeee (∩｀-´)⊃━... in catboost_ru

@kizill когда обновится документация есть информация? интересует CatboostRanker, да и в целом уже многое устарело в документации и накопились неточности

источник

17:08пожаловаться #20