Size: a a a

R language and Statistical data analysis

2020 January 10

ВК

Владимир Калинин in R language and Statistical data analysis
y~x1+x2-1?
источник

A

Andrey in R language and Statistical data analysis
Да, или y~.-1
источник

DI

Daryna Ivaskevych in R language and Statistical data analysis
Артём Клевцов
> f <- "~/Загрузки/Telegram Desktop/StatisticLogSession_1574848708307.txt"
> uchardet::detect_raw_enc(readBin(f, raw(), file.size(f)))
[1] "UTF-16"
> ced::ced_enc_detect(readBin(f, raw(), file.size(f)))
[1] "UTF-16LE"
> uchardet::detect_file_enc(f)
~/Загрузки/Telegram Desktop/StatisticLogSession_1574848708307.txt
                                                        "UTF-16"
Спасибо огромное!
источник

ВК

Владимир Калинин in R language and Statistical data analysis
Andrey
Да, или y~.-1
ответ получился другой, но все же не тот, что если бы вручную считать
источник

A

Andrey in R language and Statistical data analysis
А почему правильный ответ из 3 коэф., если фич 2?
источник

ГД

Григорий Демин in R language and Statistical data analysis
Владимир Калинин
ответ получился другой, но все же не тот, что если бы вручную считать
А как вы вручную считали? Я тремя разными способами так и не смог получить ответ  0.17, 0.62, - 0.1
источник

ВК

Владимир Калинин in R language and Statistical data analysis
свободный член включается в модель: R = L(w1, w2, w0) +w1^2 + w2^2 + w0^2
источник

ВК

Владимир Калинин in R language and Statistical data analysis
решение вручную пришлю
источник

ВК

Владимир Калинин in R language and Statistical data analysis
источник

ВК

Владимир Калинин in R language and Statistical data analysis
опустил взятие производных *
источник

ГД

Григорий Демин in R language and Statistical data analysis
Хм... насколько помню, intercept обычно не попадает под штраф - то есть регрессию делают через центр, а потом сдвиг добавляют. Плюс, обычно все переменные стандартизирует. А после подгонки регрессию возвращают к прежней шкале. Сейчас попробую ваш способ воспроизвести.
источник

ВК

Владимир Калинин in R language and Statistical data analysis
верно. вопрос в том, можно ли хитрым способ в функцию ridge это заложить
источник

ВК

Владимир Калинин in R language and Statistical data analysis
в sclearn например есть трюк
источник

ГД

Григорий Демин in R language and Statistical data analysis
У вас первое уравнение не сходится к нулю: 10*.17 + 12*.62 + 12*(-.1) - 8 = -.06
источник

ГД

Григорий Демин in R language and Statistical data analysis
Заложить просто, только лучше использовать glmnet:
library(glmnet)
train = data.frame(
   y =  c(0,1,0,3),
   x1 = c(0,1,2,3),
   x2 = c(3,2,1,0)
)
coef(glmnet(y = train$y, x = cbind(1, as.matrix(train[,-1])), alpha = 0, lambda = 1, standardize = FALSE, intercept = FALSE))
# 4 x 1 sparse Matrix of class "dgCMatrix"
#              s0
# (Intercept)  .        
#                      .        
# x1           0.5836637
# x2          -0.0193823
источник

ВК

Владимир Калинин in R language and Statistical data analysis
любопытно. большое спасибо за помощь
источник

ГД

Григорий Демин in R language and Statistical data analysis
Вот идеально ваше решение:
источник

ГД

Григорий Демин in R language and Statistical data analysis
train = data.frame(
   y =  c(0,1,0,3),
   x1 = c(0,1,2,3),
   x2 = c(3,2,1,0)
)
s_train =
   rbind(
       cbind(train, intercept = 1),
       c(0, 1, 0, 0),
       c(0, 0, 1, 0),
       c(0, 0, 0, 1)
   )

summary(lm(y ~ . - 1, data = s_train))
# Coefficients:
#             Estimate Std. Error t value Pr(>|t|)
# x1          0.6245     0.3547   1.761    0.153
# x2         -0.1028     0.3547  -0.290    0.786
# intercept   0.1739     0.8211   0.212    0.843

Без lm.ridge - я не знаю, как он внтури устроен, чтобы его обманывать)
источник

ВК

Владимир Калинин in R language and Statistical data analysis
не сходится из за округления
источник

ВК

Владимир Калинин in R language and Statistical data analysis
полагаю
источник