Size: a a a

R language and Statistical data analysis

2020 April 07

ЭА

Эдик Амперян in R language and Statistical data analysis
👏
источник
2020 April 08

A

Andrey in R language and Statistical data analysis
источник

АК

Артём Клевцов in R language and Statistical data analysis
Вычитать так и не успели, но получилось всё равно отлично. Ну и, очевидно, по извращённым пайплайнам нужна отдельная статья.
источник

АК

Артём Клевцов in R language and Statistical data analysis
Microsoft выкатила репу с материалами по прогнозированию временных рядов.
https://t.me/rlang_feed/7064
источник

A

Andrey in R language and Statistical data analysis
Артём Клевцов
Вычитать так и не успели, но получилось всё равно отлично. Ну и, очевидно, по извращённым пайплайнам нужна отдельная статья.
Да, это все с заделом на продолжение. В один пост все не впихнуть, лучше собрать фидбеки и затем выпустить сиквел
источник

АК

Артём Клевцов in R language and Statistical data analysis
Andrey
Да, это все с заделом на продолжение. В один пост все не впихнуть, лучше собрать фидбеки и затем выпустить сиквел
Согласен. Более того, видел у них в качестве енкодера keras-embeddings. Было бы интересно потрогать.
источник

A

Andrey in R language and Statistical data analysis
источник

АК

Артём Клевцов in R language and Statistical data analysis
Вроде он.
источник

АК

Артём Клевцов in R language and Statistical data analysis
Хотя, там именно енкодер был для качественных переменных.
источник

A

Andrey in R language and Statistical data analysis
(Regr|Classif)KerasFF: A fully-connected feed-forward Neural Network with entity embeddings
источник

A

Andrey in R language and Statistical data analysis
отдельно такое есть в https://github.com/tidymodels/embed
step_embed uses keras::layer_embedding to translate the original C factor levels into a set of D new variables (< C).
источник

АК

Артём Клевцов in R language and Statistical data analysis
Andrey
отдельно такое есть в https://github.com/tidymodels/embed
step_embed uses keras::layer_embedding to translate the original C factor levels into a set of D new variables (< C).
Так это ж враждебный лагерь. Да, у них и видел скорее всего.
источник

АК

Артём Клевцов in R language and Statistical data analysis
В LearnerRegrKerasFF:
use_embedding: A logical flag, should embeddings be used? Either uses make_embedding (if TRUE) or if set to FALSE model.matrix(~. - 1, data) to convert factor, logical and ordered factors into numeric features.
источник

A

Andrey in R language and Statistical data analysis
Артём Клевцов
Так это ж враждебный лагерь. Да, у них и видел скорее всего.
Я пользуюсь :) И можно портировать, наверное. Под mlr3 реализация даже проще должна быть
источник

АК

Артём Клевцов in R language and Statistical data analysis
Andrey
Я пользуюсь :) И можно портировать, наверное. Под mlr3 реализация даже проще должна быть
Я как-то писал степы для recipes. Вполне успешно, кстати, но что-то больше не хочется 😁
источник

АК

Артём Клевцов in R language and Statistical data analysis
Andrey
Я пользуюсь :) И можно портировать, наверное. Под mlr3 реализация даже проще должна быть
`LearnerRegrKerasFF` к пайплайну должен прикручиваться и встроиться как побочная ветка графа в препроцессинге.
источник

A

Andrey in R language and Statistical data analysis
не совсем https://github.com/mlr-org/mlr3keras/blob/master/vignettes/fist_steps.Rmd Тут все внутри одной нейросетки, это не отдельный этап
источник

АК

Артём Клевцов in R language and Statistical data analysis
У них есть материал по схожей тематике: https://mlr3gallery.mlr-org.com/encode-factors-for-xgboost/
источник

АК

Артём Клевцов in R language and Statistical data analysis
Добавил этот блог в список для R Feed. Вроде годные материалы.
источник

A

Andrey in R language and Statistical data analysis
Почитал справку ?step_embed, и там то же самое. Нужен таргет, это вариант таргет энкодинга. Для mlr3 готовой реализации нет, но можно сделать пайп по типу https://mlr3pipelines.mlr-org.com/reference/mlr_pipeops_encodelmer.html А внутри может быть хоть keras::layer_embedding, хоть автокодировщик, хоть любая матричная факторизация, реализованная при помощи tf
источник