Size: a a a

R language and Statistical data analysis

2020 January 13

ВК

Владимир Калинин in R language and Statistical data analysis
В итоге, нормализацию проводить необязательно, однако в некоторых случаях она может быть полезна?
источник

ВК

Владимир Калинин in R language and Statistical data analysis
в контексте деревьев решений
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Minmaxscaling и нормирование (вычесть среднее, разделить на sd) не влияет.
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Andrey
Если брать актуальные библиотеки для бустинга, то там для количественных фич как минимум в виде опции (а может и по умолчанию) используется гистограммирование. Поэтому пребразования данных могут влиять на выбор оптимальных сплитов
Если что-то более sophisticated - то могут сыграть указанные тут причины.
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
Dmitry Penzar
Дебил кто так на хабре объясняет
господа, не забывайте про миролюбие и корректность, пожалуйста
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Andrey
не надо придумывать свою терминологию и выдавать за общепринятую, это путает ньюфагов
Ну мне лично именно так рассказывали случайные леса и по ссылкам я такую трактовку находил. В sklearn есть несколько опций и все они в случае, если хороший сплит на выбранном числе фич не найден, будут смотреть вплоть до всех. Если мы ссылаемся на реализации.
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Philipp Upravitelev
господа, не забывайте про миролюбие и корректность, пожалуйста
Да, был неправ.
источник

A

Andrey in R language and Statistical data analysis
Dmitry Penzar
Minmaxscaling и нормирование (вычесть среднее, разделить на sd) не влияет.
да, такое не повлияет
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Что изначальный автор случайного леса брал сразу и то, и то - согласее
источник

A

Andrey in R language and Statistical data analysis
нашел эти объяснения, там всякие корни-логарифмы в качестве влияющих преобразований приводятся
источник

A

Andrey in R language and Statistical data analysis
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Andrey
нашел эти объяснения, там всякие корни-логарифмы в качестве влияющих преобразований приводятся
Ну да. С ними гистограмки другие будут. Я думаю, можно еще кучу придумать хитрых нормализаций, которые поменяют результат. Та же квантильная должна.
источник

ВК

Владимир Калинин in R language and Statistical data analysis
ну последний вопрос на сегодня) Это же норм, что градиентный спуск застрял в локальном минимуме при обучении логистической регрессии?🙈
источник

ВК

Владимир Калинин in R language and Statistical data analysis
или такого не должно быть
источник

A

Andrey in R language and Statistical data analysis
может быть, почему нет?
источник

ВК

Владимир Калинин in R language and Statistical data analysis
просто неповезло?
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
коллеги, напоминаю про R-митап
регистрируйтесь и приходите. может и встретимся :)

Анонс для R Moscow Meetup #5 16 января 2020
Адрес: г. Москва, Кутузовский проспект, 32к1, Сбербанк.  Митап будет в конференц зале на 2 этаже, вход в офис через подъезд 3.
Начало регистрации: 18.30.
19:00-19:30 «Решение эксплуатационных задач с помощью R для чайников» - Константин Фирсов (АО "Нетрис", Главный инженер по внедрению).
19:30-20:00 «Оптимизация товарных запасов в retail» - Генрих Ананьев (ПАО Белуга Групп, Руководитель направления автоматизации отчётности).
20:00-20:30 «BMS в X5: как сделать business-process mining на неструктурированных POS логах средствами R» - Ролдугин Евгений (:x5:, Руководитель управления инструментов контроля качества сервисов), Илья Шутов (Медиа-тел, руководитель направления data science).
Регистрация:
https://forms.gle/vY2hZC6btBYoXhxK6
источник

ИП

Иван Поздняков in R language and Statistical data analysis
Philipp Upravitelev
коллеги, напоминаю про R-митап
регистрируйтесь и приходите. может и встретимся :)

Анонс для R Moscow Meetup #5 16 января 2020
Адрес: г. Москва, Кутузовский проспект, 32к1, Сбербанк.  Митап будет в конференц зале на 2 этаже, вход в офис через подъезд 3.
Начало регистрации: 18.30.
19:00-19:30 «Решение эксплуатационных задач с помощью R для чайников» - Константин Фирсов (АО "Нетрис", Главный инженер по внедрению).
19:30-20:00 «Оптимизация товарных запасов в retail» - Генрих Ананьев (ПАО Белуга Групп, Руководитель направления автоматизации отчётности).
20:00-20:30 «BMS в X5: как сделать business-process mining на неструктурированных POS логах средствами R» - Ролдугин Евгений (:x5:, Руководитель управления инструментов контроля качества сервисов), Илья Шутов (Медиа-тел, руководитель направления data science).
Регистрация:
https://forms.gle/vY2hZC6btBYoXhxK6
а число?
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
16 января
источник

A

Alеx 🤼‍♂️ in R language and Statistical data analysis
А там подтверждение регистрации не приходит, это ок?
источник