Size: a a a

Machine learning

2021 January 21

SS

Sergey Salnikov in Machine learning
ну да, я и сказал в начале - можно с, можно без l
источник

SS

Sergey Salnikov in Machine learning
просто с практической точки зрения удобнее упрощать вычисления (оптимизация и все дела), поэтому и добавляют иногда в формулу mse 1/2, чтобы потом при взятии производной вылезшая двойка схлопнулась, и в формуле обновления весом не мешалась.
источник

SD

Sergey Djuja in Machine learning
Посмотрел работу LassoCV, на примере задачки прогноза проката великов.

LassoCV проводит кросвалидацию, подбирает альфу для регуляризации, исходя из минимума ошибки на конкретном разбиении и конкретной тестовой выборке, и coef_ параметры на этом же разбиение считает лучшими, считает решением.

Я правильно описываю что делает LassoCV?

Понимаю, что LassoCV лучше, чем просто самому один раз разбить выборку и сделать Lasso – можно совсем не угадать )

Но пахнет подгонкой под конкретное разбиение, при том мы ищем это хорошее разбиение когда бьем k раз и перебираем.

Поправьте меня если я в чем-то не прав?

Если прав, то как на практике, грех подгонки случается или нет?
источник

K

K-S in Machine learning
Sergey Salnikov
просто с практической точки зрения удобнее упрощать вычисления (оптимизация и все дела), поэтому и добавляют иногда в формулу mse 1/2, чтобы потом при взятии производной вылезшая двойка схлопнулась, и в формуле обновления весом не мешалась.
как там, кстати, спектральные эмбеддинги? Не взлетело?
источник

SS

Sergey Salnikov in Machine learning
не доварил, памяти жрет много, причем как-то странно, если указать n_jobs=4, то хочет 16G, указал n_jobs=1 - хочет 64G, можно было бы ембедить по частям, но что-то лень
источник

Ю

Юрий in Machine learning
Sergey Salnikov
не доварил, памяти жрет много, причем как-то странно, если указать n_jobs=4, то хочет 16G, указал n_jobs=1 - хочет 64G, можно было бы ембедить по частям, но что-то лень
Если не именно спектрал ембеддинг, то те же рапидс умеют в некоторые манифолды на GPU. Сегодня этот датасет раскладывал через UMAP. Занимает секунд 10, все влезает в память кернела
источник

SS

Sergey Salnikov in Machine learning
скор улучшило?
источник

SS

Sergey Salnikov in Machine learning
что за рапидс? gpu надо задейстоввать, да
источник

Ю

Юрий in Machine learning
Я еще модель не делал, да и сабмиты кончились
источник

Ю

Юрий in Machine learning
Sergey Salnikov
что за рапидс? gpu надо задейстоввать, да
источник

Ю

Юрий in Machine learning
Sergey Salnikov
что за рапидс? gpu надо задейстоввать, да
источник

K

K-S in Machine learning
Юрий
Если не именно спектрал ембеддинг, то те же рапидс умеют в некоторые манифолды на GPU. Сегодня этот датасет раскладывал через UMAP. Занимает секунд 10, все влезает в память кернела
Я UMAP эмбеддинги в начале пробовал — ничего. Правда, я его не тюнил, надо сказать
источник

Ю

Юрий in Machine learning
K-S
Я UMAP эмбеддинги в начале пробовал — ничего. Правда, я его не тюнил, надо сказать
Я "на глаз" потюнил, чтоб хоть какие-то явные кластеры получились и так оставил
источник

SS

Sergey Salnikov in Machine learning
там 1е место вообще в отрыв ушел
источник

K

K-S in Machine learning
возможно, понял, как данные были сгенерированы
источник
2021 January 22

AO

Alex Ololo in Machine learning
помните мы матрицы когда учили, нам рассказывали что есть такая тема как избыточность информации или как-то так
когда у тебя в данных одна и та же инфа по разному записана и есть даже какой-то прием работы с матрицей чтобы вычислить факт наличия такой избыточности
как это нормально называется? забыл
источник

A

Aroh in Machine learning
коллинеарность?
источник

A

Alexander in Machine learning
Alex Ololo
помните мы матрицы когда учили, нам рассказывали что есть такая тема как избыточность информации или как-то так
когда у тебя в данных одна и та же инфа по разному записана и есть даже какой-то прием работы с матрицей чтобы вычислить факт наличия такой избыточности
как это нормально называется? забыл
Линейная зависимость. rang матрицы используйте.
источник

AO

Alex Ololo in Machine learning
точно
источник

i

igor in Machine learning
Звучит странно
источник