Size: a a a

2020 July 23

ND

Nikita Dmitriev in catboost_ru
Привет!

Можете попробовать решить эту задачу катбустом, да
Есть вероятность, что какая-нибудь нейронка справится с такой задачей лучше, но зато катбуст настраивать не нужно)
источник

МН

Максим Новопольцев... in catboost_ru
Stanislav Kirillov
Обучение хотим добить в Q3, ближе к сентябрю будем искать бета-тестеров которые смогут помочь с тестированием и дать фидбек
где записываться в добровольцы?)
источник

SK

Stanislav Kirillov in catboost_ru
Записал в писок, прям тут записываться)
источник

DD

Dmitry Dmitriev in catboost_ru
Привет. Катбуст вдруг стал работать в ~10 раз медленнее на том же массиве данных. В чем может быть проблема?
источник

y

yithian in catboost_ru
В окружении.
источник

SK

Stanislav Kirillov in catboost_ru
Привет! А в какой версии?
источник

SK

Stanislav Kirillov in catboost_ru
если это внутри одной версии, то да, проблема в окружении
источник

DD

Dmitry Dmitriev in catboost_ru
Да, внутри одной. Ничего не менялось.
источник

SK

Stanislav Kirillov in catboost_ru
так не бывает 🙂
источник

AK

Andrew Kolesnichenko in catboost_ru
а как в яндексе обучают катбуст? там спарк? может где-то есть доклад?
источник

VE

Vasily Ershov in catboost_ru
Andrew Kolesnichenko
а как в яндексе обучают катбуст? там спарк? может где-то есть доклад?
GPU в основном
источник

DL

Dmitri Lihhatsov in catboost_ru
Andrew Kolesnichenko
а как в яндексе обучают катбуст? там спарк? может где-то есть доклад?
Как в Яндексе не знаю, а мы в Революте обучаем Catboost на Google Cloud, через AI Platform, Custom Code Training. 🙂

По сути просто выкачиваются training data из BigQuery и потом на n1-highmem-16, на CPU тренируется часов 6.
источник

SK

Stanislav Kirillov in catboost_ru
У нас своя система запуска задач на кластере, Нирвана (https://www.youtube.com/watch?v=pOi9YWz__g0)
источник

SK

Stanislav Kirillov in catboost_ru
соответственно есть разные кубики для обучения моделей, в том числе для катбуста
источник

SK

Stanislav Kirillov in catboost_ru
данные лежат в основном в нашем YT - Yandex Table
источник

AB

Alexey Babenkov in catboost_ru
а если не влезает в оперативку все?
источник

SK

Stanislav Kirillov in catboost_ru
Есть распределенное обучение
источник

SK

Stanislav Kirillov in catboost_ru
и GPU и CPU
источник

SK

Stanislav Kirillov in catboost_ru
Оно есть и в OpenSource катбусте
источник

AK

Andrew Kolesnichenko in catboost_ru
спасибо!
источник