Size: a a a

AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

2021 March 22

TN

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ilya
а я вот задумался, по идеи если там детач, то торчу и нет причины держать в памяти никакие данные связанные с исчислениями того тензора, который детачится, по идеи верно ?
Наверное надо как следует про профайлить память.
Пока торч не дойдет до detach - он не будет знать о том, что вам эта часть графа не нужна в backward, и до того момента он будет копить градиенты. И пока у вас есть хоть одна ссылка на не-detach-нутую переменную - он не освободит эту память
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Timofey Naumenko
Пока торч не дойдет до detach - он не будет знать о том, что вам эта часть графа не нужна в backward, и до того момента он будет копить градиенты. И пока у вас есть хоть одна ссылка на не-detach-нутую переменную - он не освободит эту память
Точно, наоборот от того что сказал, require_grad же Тру
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
После он не копит.
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ilya
Точно, наоборот от того что сказал, require_grad же Тру
Хотя я как бы смотрел с позиции бэкпеса (обратное направление) , то есть имел ввиду "будущие исчисления", но так более внятно.
источник

TN

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ilya
Хотя я как бы смотрел с позиции бэкпеса (обратное направление) , то есть имел ввиду "будущие исчисления", но так более внятно.
Я не понял. Вы имеете в виду, что при построении графа autograd должен озаботиться тем, что сохранять только то, что ему понадобится для backward?
источник

BI

Behruz Inomov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Здравствуйте ребят, если вы построите несколько моделей по какому показателю определите лучшую модель? AUC, F1 score? Gini Index...?
источник

TN

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Behruz Inomov
Здравствуйте ребят, если вы построите несколько моделей по какому показателю определите лучшую модель? AUC, F1 score? Gini Index...?
Это зависит от того, что эти модели должны делать
источник

BI

Behruz Inomov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Timofey Naumenko
Это зависит от того, что эти модели должны делать
В задаче кредитного скоринга, определяем, плохой или хороший клиент
источник

TN

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
David Dale
Метрики типа accuracy, precision, recall, F1 все делают предположение, что порог отсечения зафиксирован. Но это предположение для многих практических применений неок - во-первых, порог может меняться в зависимости от внешних обстоятельств, во-вторых, порогов вообще может быть несколько.
В ситуации с тем же кредитом, например, можно при <10% вероятности невозврата сразу давать кредит, при >20% отказывать, а при вероятности 10-20% - проводить дополнительную проверку.
Вот тут хорошо сказано.
источник

TN

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Roc auc должен хорошо себя показать тут (однако замечу, что я не занимался задачей кредитного скоринга)
источник

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Timofey Naumenko
Roc auc должен хорошо себя показать тут (однако замечу, что я не занимался задачей кредитного скоринга)
Я занимался, подтверждаю)
Все банки именно этой метрикой пользуются.
А если вы посчитаете ROCAUC * 2 - 1 и назовёте это Джини, то точно за своего сойдёт)
источник

TN

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
David Dale
Я занимался, подтверждаю)
Все банки именно этой метрикой пользуются.
А если вы посчитаете ROCAUC * 2 - 1 и назовёте это Джини, то точно за своего сойдёт)
А почему бы сразу не использовать ошибку матожидания по "столько потеряли на не вернувших, и столько получили с вернувших"?
источник

TN

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Для этого, понятно, надо знать специфичные для банка коэффициенты, но, имхо, так будет точнее
источник

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Timofey Naumenko
А почему бы сразу не использовать ошибку матожидания по "столько потеряли на не вернувших, и столько получили с вернувших"?
Чтобы заранее не выбирать порог, ведь его выбор сильно зависит от внешних факторов (процентных ставок на рынке, доли разных клиентов во входном потоке, которая зависит от маркетинговых кампаний, общего экономического положения в стране и т.п.), которые могут быстро меняться.
источник

TN

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
М, ну да
А если делать метрику, знающую, как она будет влиять на экономическую систему - то это уже оверкилл для быстрого прототипирования моделек
источник

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Timofey Naumenko
М, ну да
А если делать метрику, знающую, как она будет влиять на экономическую систему - то это уже оверкилл для быстрого прототипирования моделек
Мы такие метрики тоже считали, но в них было заложено столько героических экономических допущений, что по сравнению с ними ROC AUC казалась супер простой и интерпретируемой.
источник

TN

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Понял, справедливо:)
источник

@

@Evgeniia_Orlova in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
привет всем!
источник

@

@Evgeniia_Orlova in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
я знаю, что в выходные были вопросы про собеседование в ML
источник

АК

Андрей Копылов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
@Evgeniia_Orlova
я знаю, что в выходные были вопросы про собеседование в ML
Добрый день! Да, интересно)
источник