Телеграмм чат группы datasciencecourse страница 4790

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Machine learning

7805 membersпожаловаться на группу

2021 February 14

A

Aleksey in Machine learning

Добрый день.
Вопрос: При снижении размерности как быть с бинарными признаками, с ними тоже приводить стандартизацию для снижения размерности или добавлять их в виде 0/1 после стандартизации ? Или мб есть пример и как правильно ?

источник

15:58пожаловаться #1

I

Ibp in Machine learning

Егор Овчинников

Спасибо!
Я в данном вопросе больше интересуюсь общим пониманием. Не только в ключе того сета. Хочу понять, РАЗ И НАВСЕГДА, просто последовательность применения подобных методов. Я так понимаю ты просто после обучения модели смотрел feature_importances? И признаки с самыми низкими значениями удалял?

есть такой подход, если мы говорим о моделях. у которых есть атрибут coef_ или feature_importances_, как в xgboost - SelectFromModel sklern. допустим, у вас есть 62 признака значимых, вы их сортируете по значимости и начинаете с помощью этого прибамбаса удалять по одному признаку и смотреть что получится, как в примере. В итоге вы увидите минимальтное количество признаков, которое можно оставить без понижения скора

источник

16:04пожаловаться #2

I

Ibp in Machine learning

и там, касательно xgboost, есть два вида важности признаков. по умолчанию оно показывает, как в графике plot_importance важности важные с точки зрения регрессии. их можно выудить следующим способом:

источник

16:09пожаловаться #3

I

Ibp in Machine learning

а есть еще важности для классификации, они получаются следующим способом:

источник

16:11пожаловаться #4

I

Ibp in Machine learning

или тоже самое взвешенное:

источник

16:12пожаловаться #5

ЕО

Егор Овчинников... in Machine learning

Ibp

есть такой подход, если мы говорим о моделях. у которых есть атрибут coef_ или feature_importances_, как в xgboost - SelectFromModel sklern. допустим, у вас есть 62 признака значимых, вы их сортируете по значимости и начинаете с помощью этого прибамбаса удалять по одному признаку и смотреть что получится, как в примере. В итоге вы увидите минимальтное количество признаков, которое можно оставить без понижения скора

Гуд! Спасибо!!!!!!!!!

источник

16:12пожаловаться #6

ЕО

Егор Овчинников... in Machine learning

Есть хорошая книга feature selection max kuhn

Скачал!👍🏻

источник

16:12пожаловаться #7

ЕО

Егор Овчинников... in Machine learning

Спасибо!

источник

16:12пожаловаться #8

AP

Alexander Petrenko in Machine learning

Егор Овчинников

Спасибо!
Я в данном вопросе больше интересуюсь общим пониманием. Не только в ключе того сета. Хочу понять, РАЗ И НАВСЕГДА, просто последовательность применения подобных методов. Я так понимаю ты просто после обучения модели смотрел feature_importances? И признаки с самыми низкими значениями удалял?

Что-то типа features_importances. Точно не помню как называется. Комп не под рукой. Помню там было два способа вызова информации о значимости признаков. Могу в личку ссылку скинуть на гитхаб свой с этим датасетом. Надо?:)

источник

16:14пожаловаться #9

ЕО

Егор Овчинников... in Machine learning

Супер! Буду рад!

источник

16:20пожаловаться #10

i

igor in Machine learning

Обратите внимание в книге все детално разбирается

источник

16:22пожаловаться #11

i

igor in Machine learning

источник

16:22пожаловаться #12

AP

Alexander Petrenko in Machine learning

👍

источник

16:28пожаловаться #13

ЕО

Егор Овчинников... in Machine learning

Feature_Engineering_and_Selection_A_Practical_Approach_for_Predictive.pdf

Может надо кому-нибудь....

источник

17:23пожаловаться #14

A

An in Machine learning

юзайте пермутейшн импортанс и shap

источник

17:33пожаловаться #15

ЕО

Егор Овчинников... in Machine learning

🤔Интересно) Ответьте. Вы сейчас работаете дата сайнтистом?

Анонимный опрос

14%

Да

86%

Нет

Проголосовало: 133

источник

18:13пожаловаться #16

DP

Dmitry Penzar in Machine learning

Егор Овчинников

Супер! Буду рад!

В том, что скинул esperanto особое внимание оьратите на overfitting to predictors

источник

18:32пожаловаться #17

DP

Dmitry Penzar in Machine learning

Если коротко - фичи - это фактически гиперпараметры модели. И выбирать их надо как гиперпараметры

источник

18:33пожаловаться #18

DP

Dmitry Penzar in Machine learning

Иначе можете проделать простой эксперимент

Генерим случайно вектор Y из 0 и 1 размера n. И матрицу X размера nxm, тоже из 0 и 1. m - это признаки.
Можете легко набрать "значимых признаков", если не будете кроссвалидироваться

источник

18:35пожаловаться #19

ЕО

Егор Овчинников... in Machine learning

👍🏻

источник

19:04пожаловаться #20