Size: a a a

Machine learning

2021 January 21

SS

Sergey Salnikov in Machine learning
да, попробуй другие манифолды, если будет время, там остается только подобными топологическими методами фичеинженирить
источник

Ю

Юрий in Machine learning
Sergey Salnikov
так подвыборка - всего 10К, при масштабировании размоется немного
Эх, сколько гипотез подтвердилось у меня на такой подвыборке, и сколько из них разбилось о регрессию к среднему (100%)😭
источник

SS

Sergey Salnikov in Machine learning
ну будем посмотреть )
источник

K

K-S in Machine learning
Юрий
Эх, сколько гипотез подтвердилось у меня на такой подвыборке, и сколько из них разбилось о регрессию к среднему (100%)😭
У меня вот есть одна гипотеза относительно этого)
источник

K

K-S in Machine learning
А данные они,  интересно, снова в sklearn.make_regression сгенерировали?)
источник

DO

Denis O in Machine learning
Svetlana Astafyeva
Я делала Парето. Все отлично получилось 😉
Подскажи пожалуйста, какое степенное значение использовала и как делала гистограмму?

Судя по определению распределения Парето в Вики, степенное значение должно быть > 3, чтоб была определена дисперсия.

Но при этом значении - разброс слишком большой, и гистограмма с линейными шкалами не подходит.

Была мысль делать через веса, но сложновато с 30 минутами опыта работы в питоне 🙂

Скриншоты ниже...

Спасибо!)
источник

ЕО

Егор Овчинников... in Machine learning
Подскажите пожалуйста, когда нужно делать get_dummies(), а когда это очень вредит?
источник

DO

Denis O in Machine learning
источник

DO

Denis O in Machine learning
c = 0.1
источник

DO

Denis O in Machine learning
источник

DO

Denis O in Machine learning
c = 0.5
источник

DO

Denis O in Machine learning
источник

DO

Denis O in Machine learning
c = 3.01
источник

SA

Svetlana Astafyeva in Machine learning
Denis O
Подскажи пожалуйста, какое степенное значение использовала и как делала гистограмму?

Судя по определению распределения Парето в Вики, степенное значение должно быть > 3, чтоб была определена дисперсия.

Но при этом значении - разброс слишком большой, и гистограмма с линейными шкалами не подходит.

Была мысль делать через веса, но сложновато с 30 минутами опыта работы в питоне 🙂

Скриншоты ниже...

Спасибо!)
Судя по всему вы берете не то распределение в scipy.
Посмотрите, там есть распределения Парето))
Генпарето и ещё одно.
И посмотрите в документации.
Вы в итоге будете делать, используя один параметр
источник

DO

Denis O in Machine learning
Использую генпарето с одним параметром(код выше). А какой у вас размер параметра был, не подскажете?
Спасибо
источник

SA

Svetlana Astafyeva in Machine learning
Denis O
Использую генпарето с одним параметром(код выше). А какой у вас размер параметра был, не подскажете?
Спасибо
Посмотрю попозже, напишу вам
источник

DO

Denis O in Machine learning
Благодарю!
источник

SA

Svetlana Astafyeva in Machine learning
scipy.stats.pareto — SciPy v1.6.0 Reference Guide
https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.pareto.html
источник

SA

Svetlana Astafyeva in Machine learning
Denis O
Благодарю!
Вот в документации берется параметр b=2.62
Попробуйте его.
источник

DO

Denis O in Machine learning
Да, спасибо, почему-то это распределение генерирует более ожидаемые результаты
источник