Size: a a a

2021 May 28

n

nev in catboost_ru
успехи есть, сабмита нет
источник

n

nev in catboost_ru
просим прощения
источник

TB

Taras B in catboost_ru
Да, было бы хорошо. Как и эмбеддинги использовать вне питона
источник
2021 May 29

ВК

Вячеслав Колосков... in catboost_ru
добрый день
не подскажите, что значит эта ошибка?
Cannot convert IntegerArray to numpy.ndarray
источник

ВК

Вячеслав Колосков... in catboost_ru
получаю ее когда пытаюсь запустить randomized_search
источник

LD

Lednik Dwarf in catboost_ru
Попробуйте вручную отредактировать типы колонок
источник
2021 May 30

AK

Andrei Khropov in catboost_ru
Напрямую сейчас нельзя. Все-таки параметры модели - это параметры ее как типа Transformer. Хотя, действительно, некоторые Estimators в Spark MLLib копируют параметры обучения как параметры в модель, но в документации API вроде бы нигде нет такого требования.

Сейчас посмотреть можно только если не через Spark API, внутри себя в моделях есть метаданные и в сериализованных моделях они тоже хранятся. Если сохранить модель в локальный файл через saveNativeModel, потом можно из нее достать параметры обучения с помощью обычных локальных функций. В частности в JVM можно с помощью пакета catboost-prediction (https://catboost.ai/docs/concepts/java-package.html) загрузить модель, а дальше вызывать у нее функцию [getMetadata](https://github.com/catboost/catboost/blob/a067afb547f921353877bc3c7e30fdf01e3f3540/catboost/jvm-packages/catboost4j-prediction/src/main/java/ai/catboost/CatBoostModel.java#L315), в значении для ключа params будут параметры в виде JSON.

Но вообще это не очень удобно, конечно. Сделаем API поудобнее: https://github.com/catboost/catboost/issues/1723
источник

KB

Kirill Bordovskiy in catboost_ru
Понял, спасибо!
С сохранением интересный способ, пока его тогда попробую
источник

L

LS in catboost_ru
👋 Сразу после 0.25.1 будет 0.26? Что то значительное в релизе будет?
источник

SK

Stanislav Kirillov in catboost_ru
По объему полезных фичей - вполне тянет на 0.26, у нас было около 10 ПР от контрибьюторов:) скоро запостим чейнджнотисы.
источник

ВК

Вячеслав Колосков... in catboost_ru
так и сделал в итоге. принудительно сделал для все колонок astype(float), тогда заработало. но вроде и так у всех колонок был подходящий тип (флоат и инт)
источник

LD

Lednik Dwarf in catboost_ru
Такое бывает, когда используешь типы питона, а не нампая
источник

L

LS in catboost_ru
👍
источник
2021 May 31

P🐈

Pavel Tyavin 🐈 in catboost_ru
Как кэтбуст работает с несколькими текстовыми фичами? Множество токенов объединяется? Есть ли смысл делать несколько текстовых фичей, или можно законкатить всё в одно?
источник

ЕП

Евгений Петров... in catboost_ru
@paveltyavin текстовая фича заменяется на одну или несколько числовых на основе частот встречаемости токенов. априори кажется, что лучше не объединять всё в одну фичу, т.к. разное распределение частот для разных фичей может нести полезную информацию. вот описание на английском https://catboost.ai/docs/concepts/algorithm-main-stages_text-to-numeric.html
источник
2021 June 01

L

LS in catboost_ru
Подскажите пожалуйста, какие параметры важны при выборе видеокарты для обучения на numerical data? Нашёл только обучение с img, правда это не мой случай)  есть выбор взять сервер на месяц с 1080ti или 3080, разница в цене чуть менее 10%, но вот если 3080 будет быстрее то переплата полностью оправдана.
источник

IP

Igor Popov in catboost_ru
в память датасет влезть полностью должен)
источник

L

LS in catboost_ru
Ram amount или memory bandwidth?
источник

L

LS in catboost_ru
То есть train & validation должны весить ~10 гиг для 3080 и ~11гиг для 1080?
источник

IP

Igor Popov in catboost_ru
Incremental training на гпу вроде еще не запилили, но можно использовать фичу бэйзлайна. Если в 10 гигов данные влезают то 3080 думаю будет шустрее)
источник