Size: a a a

Machine learning

2021 February 10

DP

Dmitry Penzar in Machine learning
В результате может любая хтонь возникать
источник

DP

Dmitry Penzar in Machine learning
Ну и плюс ваш тест получен как? Если отдельно от трэйн, то почему нет
источник

DL

Dennis Lisitsin in Machine learning
Dmitry Penzar
Ну и плюс ваш тест получен как? Если отдельно от трэйн, то почему нет
попробовал, не сработало. тест со стратификацией делал:
источник

DL

Dennis Lisitsin in Machine learning
источник

DL

Dennis Lisitsin in Machine learning
Dennis Lisitsin
всем привет! ситуация такая: при бинарной классификации roc auc (классы почти равны) странное дело - на всем объеме 0.69, а при кросс-валидации на 5 фолдов по 0.75. не подскажете, в чем может быть дело? когда наоборот понятно, а такое?
вроде въехал. на будущее, если кто по чату будет искать: если верно понимаю (поправьте, пжл, если ошибаюсь), то roc_auc_score ожидает на вход predict_proba, а не готовый ответ. тогда как cross_val_score считает вероятность сам при scoring='roc_auc'. опираюсь на это из SO: https://stackoverflow.com/questions/22318922/scikit-learn-roc-auc-score-returns-accuracy-values и да, мою проблему решило полностью.
источник

SS

Sergey Salnikov in Machine learning
надо predict_proba, а не predict
источник

SS

Sergey Salnikov in Machine learning
упс, опередил
источник

DL

Dennis Lisitsin in Machine learning
Sergey Salnikov
надо predict_proba, а не predict
да, спасибо! я прозрел наконец)
источник

DP

Dmitry Penzar in Machine learning
Sergey Salnikov
упс, опередил
А, кек. Кстати да, частая ошипка
источник

SS

Sergey Salnikov in Machine learning
ну не знаю, имхо задач классификации больше, я уже привык по-дефолту использовать predict_proba, иногда удивляюсь, когда его нет (например у LinearSVC), приходится извращаться
источник

DP

Dmitry Penzar in Machine learning
Dennis Lisitsin
вроде въехал. на будущее, если кто по чату будет искать: если верно понимаю (поправьте, пжл, если ошибаюсь), то roc_auc_score ожидает на вход predict_proba, а не готовый ответ. тогда как cross_val_score считает вероятность сам при scoring='roc_auc'. опираюсь на это из SO: https://stackoverflow.com/questions/22318922/scikit-learn-roc-auc-score-returns-accuracy-values и да, мою проблему решило полностью.
Roc auc score ожидает на вход любой скор 1го класса (например, svm decision function тоже подойдет). И если передать туда 0 и 1 он тоже все посчитает, ибо это нормальный скор
источник

DP

Dmitry Penzar in Machine learning
Ну вот у svc спокойно decision function заходит
источник

SS

Sergey Salnikov in Machine learning
да, потом сверху иногда softmax-ом полернуть
источник

DP

Dmitry Penzar in Machine learning
Ну либо делать плат скейлинг, который дорог и нафиг
источник
2021 February 11

S

Sihjil in Machine learning
Dmitry
Странно. Я сдал со второго раза, и то только потому, что не заметил, что 6 файл с ответом не загрузился, минут 40 убил на чтение форума и перепроверку, а потом дошло где проблема)
Я уже несколько дней не пойму, где ошибаюсь. Рекомендации учёл, но допускаю, что в параметрах не все верно выставляю в GridSearchCV
источник

K

K-S in Machine learning
Dmitry Penzar
Ну либо делать плат скейлинг, который дорог и нафиг
почему дорог? Обычная ведь логистическая регрессия
источник

DP

Dmitry Penzar in Machine learning
K-S
почему дорог? Обычная ведь логистическая регрессия
Ну ее надо кроссвалидировать
источник

DP

Dmitry Penzar in Machine learning
Иначе тупо переобучится. Потому условный SVC, который и сам по себе не быстрый, замедляется в число фолдов раз
источник

DP

Dmitry Penzar in Machine learning
Просто же фигачить на это сигмоиду/софтмакс нельзя, ибо нет никакой гарантии, что вероятности не станут маппиться криво. К примеру, в сигмоиде 0му скору должна соответствовать ситуация : классификатор вообще не знает, к какому классу это относится. Чтобы получалось 0.5. А в svm-loss нет никакого требования на центрированность скоров около 0
источник

АК

Алина Коробчук... in Machine learning
Здравствуйте! Посоветуйте пожалуйста курс чисто по Python хороший, можно и платный. С направлением анализ данных
источник