Телеграмм чат группы rlang_ru страница 19

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

R language and Statistical data analysis

1000 membersпожаловаться на группу

1
«
…
‹
14
15
16
17
18
19
20
›
…
»

2017 October 09

A

Andrey in R language and Statistical data analysis

Частичное присваивание лучше в data.table делать через :=

источник

11:00пожаловаться #1

AC

Andrey C. in R language and Statistical data analysis

Там есть case_which или типа того, см справку

case_when

источник

11:12пожаловаться #2

JS

Jury Sergeev in R language and Statistical data analysis

а как пайпы работаю в dplyr - один за другим? или чанками могут?

источник

11:21пожаловаться #3

A

Andrey in R language and Statistical data analysis

Один за одним

источник

11:42пожаловаться #4

A

Andrey in R language and Statistical data analysis

Есть пакет chunked, но это все полумеры.

источник

11:42пожаловаться #5

JS

Jury Sergeev in R language and Statistical data analysis

жаль-жаль

источник

12:04пожаловаться #6

JS

Jury Sergeev in R language and Statistical data analysis

получается надо пилить dplyr с поддержкой чанков

источник

12:04пожаловаться #7

JS

Jury Sergeev in R language and Statistical data analysis

а так было бы заманчиво, читать частями, обрабатывать и складировать

источник

12:05пожаловаться #8

JS

Jury Sergeev in R language and Statistical data analysis

руками такое делал, через foreach и dplyr для части данных внутри foreach, и финальный dplyr пайп после конкатенации результатов

источник

12:06пожаловаться #9

A

Alexander in R language and Statistical data analysis

Спасибо, буду пробовать!

источник

12:38пожаловаться #10

A

Alexander in R language and Statistical data analysis

Там есть case_which или типа того, см справку

источник

12:38пожаловаться #11

A

Alexander in R language and Statistical data analysis

case_when

источник

12:38пожаловаться #12

KP

Konstantin Panfilov in R language and Statistical data analysis

Может кто сталкивался:
строю линейную модель
у меня есть 3 категориальных переменные, в каждой примерно ~ 500 разных значений
делаю one-hot-encodding, кодирую 0 и 1

Помимо этого есть еще 3 числовых предиката - по хорошему их надо как-то отскалировать, знаю два популярных способа: (x - min(x)) / (max(x) -min(x)) и (x - mean(x))/sd(x)

Влияют ли как-то переменные, полученные из one-hot encodding на выбор как нужно скалировать переменные?

извините за слово "скалировать", вылетело из головы, как сказать это по-русски

источник

14:58пожаловаться #13

PU

Philipp Upravitelev in R language and Statistical data analysis

есть же scales::rescale ()

вообще, предикторы вроде как должны быть независимы

источник

15:01пожаловаться #14

PU

Philipp Upravitelev in R language and Statistical data analysis

кстати, а зачем масштабировать вообще?
это ж не кластерный

источник

15:03пожаловаться #15

KP

Konstantin Panfilov in R language and Statistical data analysis

при построении линейных моделей без масштабирования признаков можно получить что-то вообще далекое от желаемого

источник

15:04пожаловаться #16

A

Andrey in R language and Statistical data analysis

Чтобы коэффициенты сравнивать, наверное

источник

15:04пожаловаться #17

A

Andrey in R language and Statistical data analysis

Konstantin Panfilov

при построении линейных моделей без масштабирования признаков можно получить что-то вообще далекое от желаемого

Изменится только масштаб коэффициентов

источник

15:04пожаловаться #18

KP

Konstantin Panfilov in R language and Statistical data analysis

я не упомянул про регуляризацию..

источник

15:05пожаловаться #19

KP

Konstantin Panfilov in R language and Statistical data analysis

насколько я понимаю, с немасштабированными признаками регуляризация отработает неточно

источник

15:05пожаловаться #20

1
«
…
‹
14
15
16
17
18
19
20
›
…
»