Size: a a a

2020 July 21

AN

Alex Nemoy in catboost_ru
Спасибо за ссылки. Но вопрос в том как в обученной модели посмотреть собранные словари и фичи. Ведь они сохраняются в модели или по сути не нужны после обучения ?
источник

ЕП

Евгений Петров... in catboost_ru
Alex Nemoy
Спасибо за ссылки. Но вопрос в том как в обученной модели посмотреть собранные словари и фичи. Ведь они сохраняются в модели или по сути не нужны после обучения ?
словари нужны для применения и сохраняются в модель.
извлечь их пока нельзя :(
если очень нужен словарь, то можно простроить его с помощью классов Tokenizer и Dictionary вот по этому рецепту https://catboost.ai/docs/concepts/algorithm-main-stages_text-to-numeric.html
источник

AN

Alex Nemoy in catboost_ru
словарь построить получается но как его применить к модели ? я так понимаю модель сама строит словари по настройкам в text_processing и эти словари недоступны в модели ?
источник

ЕП

Евгений Петров... in catboost_ru
да, словарь строится в начале обучения и записывается в модель. технически можно извлечь словарь из модели, но пока это не реализовано.
источник

SK

Stanislav Kirillov in catboost_ru
Всем привет! Мы гачали реализовывать поддержку Spark и поэтому хотелось бы оценить количество людей, кому это будет полезно (и какая именно функция - применение или обучение в первую очередь вам интересна). Просьба ответить всем заинтересованным :)
Анонимный опрос
32%
Использую Spark, жду поддержки обучения (и применения) CatBoost в Spark
4%
Использую Spark, жду поддержки применения моделей CatBoost в Spark
3%
Использую Spark, поддержка CatBoost на Spark не нужна
61%
Не используем Spark
Проголосовало: 128
источник

SS

Sergey Salnikov in catboost_ru
имхо важнее распараллеливание обучения возможностями spark-а. применять можно и существующими решениями
источник

IP

Igor Popov in catboost_ru
Stanislav Kirillov
Всем привет! Мы гачали реализовывать поддержку Spark и поэтому хотелось бы оценить количество людей, кому это будет полезно (и какая именно функция - применение или обучение в первую очередь вам интересна). Просьба ответить всем заинтересованным :)
Анонимный опрос
32%
Использую Spark, жду поддержки обучения (и применения) CatBoost в Spark
4%
Использую Spark, жду поддержки применения моделей CatBoost в Spark
3%
Использую Spark, поддержка CatBoost на Spark не нужна
61%
Не используем Spark
Проголосовало: 128
Можно подробнее, что подразумевается под применением?
источник

IP

Igor Popov in catboost_ru
Исполнение батчами?
источник

SK

Stanislav Kirillov in catboost_ru
Да, просто стриминг-применение модельки
источник

A

Algorc in catboost_ru
А я думал, что указываешь путь к паркету/hive-табличке и путь к файлу с моделью и получаешь паркет с предсказнием.
источник

IP

Igor Popov in catboost_ru
Какие планируются сроки релиза такой фичи?
источник

SK

Stanislav Kirillov in catboost_ru
Обучение хотим добить в Q3, ближе к сентябрю будем искать бета-тестеров которые смогут помочь с тестированием и дать фидбек
источник

IP

Igor Popov in catboost_ru
Спасибо
источник

SK

Stanislav Kirillov in catboost_ru
Вы бы хотели стать нашим тестером?
источник

IP

Igor Popov in catboost_ru
Мои источники данных находятся в Сбере, там не получится из-за политики безопасности, при всем желании
источник

SK

Stanislav Kirillov in catboost_ru
в смысле там нельзя пользоваться катбустом?
источник

Аa

Андрей amber4eg... in catboost_ru
В опрос тыкать не буду, но с моего дивана обучение на спарке важнее - данных для обучения много, а применение и так феерически шустрое
источник

IP

Igor Popov in catboost_ru
Нет, можно, но мы напрямую качать с гита не можем, качаем с локального индекса pip, это задержка уже после внедрения релиза на несколько недель
источник

SK

Stanislav Kirillov in catboost_ru
А, понятно!
источник

IP

Igor Popov in catboost_ru
Уходит время на проверку исходного кода и на репликацию, на ОПЭ и тп. В итоге по версиям у нас отставание на несколько недель
источник