Size: a a a

R language and Statistical data analysis

2020 January 07

A

Andrey in R language and Statistical data analysis
b0 - это просто обучаемый параметр. Можно назвать его b'0 и b0 затем посчитать как логарифм от b'0
источник

IM

I M in R language and Statistical data analysis
Может тут лучше glm использовать? С link="log"
источник

A

Andrey in R language and Statistical data analysis
Это разные вещи
источник

A

Andrey in R language and Statistical data analysis
(Не то же самое, что построить линейную модель на логарифмах фич и таргета)
источник

ВК

Владимир Калинин in R language and Statistical data analysis
так b0 это свободный член
источник

ВК

Владимир Калинин in R language and Statistical data analysis
прост константа
источник

ВК

Владимир Калинин in R language and Statistical data analysis
что значит ln(b0) ?
источник

A

Andrey in R language and Statistical data analysis
I M
Может тут лучше glm использовать? С link="log"
No. First of all, GLM doesn't in any way modify anything on the independent variable side.

But it is also not equivalent to log-transforming the dependent variable. If you log transform the independent variable you are estimating a model that says:

E(log y) = b0 + b1X1 + ...
In particular, this kind of model cannot be used if y can be zero or negative, because then log y is undefined.

When you use GLM with the log link, you are estimating a model that says:
log(E(y)) = b0 + b1X + ...
Note that this kind of model can still be applied when y takes on zero or negative values, though the model necessarily constrains E(y) to be positive.

[In the above, E denotes expectation.]
https://www.statalist.org/forums/forum/general-stata-discussion/general/1314729-understanding-glm-link-log
источник

IM

I M in R language and Statistical data analysis
Andrey
No. First of all, GLM doesn't in any way modify anything on the independent variable side.

But it is also not equivalent to log-transforming the dependent variable. If you log transform the independent variable you are estimating a model that says:

E(log y) = b0 + b1X1 + ...
In particular, this kind of model cannot be used if y can be zero or negative, because then log y is undefined.

When you use GLM with the log link, you are estimating a model that says:
log(E(y)) = b0 + b1X + ...
Note that this kind of model can still be applied when y takes on zero or negative values, though the model necessarily constrains E(y) to be positive.

[In the above, E denotes expectation.]
https://www.statalist.org/forums/forum/general-stata-discussion/general/1314729-understanding-glm-link-log
Ага, понял
источник

MS

Maria Servetnik in R language and Statistical data analysis
Andrey
b0 - это просто обучаемый параметр. Можно назвать его b'0 и b0 затем посчитать как логарифм от b'0
да, собственно, я сейчас делаю именно это, только перепутала экспоненту и логарифм, отредактировала. вопрос в том, будут ли остальные данные в модели верны при b'0 = ln(b0), и если нет (а я вроде прихожу к тому, что не будут?..), то есть ли какой-то способ их посчитать иначе, чем руками
источник

MS

Maria Servetnik in R language and Statistical data analysis
Владимир Калинин
что значит ln(b0) ?
там изначально задача (учебная, если что) взять уравнение y = b0*x^b1, преобразовать в линейное уравнение и зафитить модель. то есть, я просто логарифмирую левую и правую сторону, получаю ln(y) = ln(b0) + b1*ln(x). и вот мне интересно, можно ли как-то этот ln(b0) включить в модель
источник

A

Andrey in R language and Statistical data analysis
Maria Servetnik
там изначально задача (учебная, если что) взять уравнение y = b0*x^b1, преобразовать в линейное уравнение и зафитить модель. то есть, я просто логарифмирую левую и правую сторону, получаю ln(y) = ln(b0) + b1*ln(x). и вот мне интересно, можно ли как-то этот ln(b0) включить в модель
не могу сходу пояснить, но это работать не будет, т.к. модель  y = b0*x^b1 не является линейной по параметрам
источник

👁

👁 in R language and Statistical data analysis
Maria Servetnik
там изначально задача (учебная, если что) взять уравнение y = b0*x^b1, преобразовать в линейное уравнение и зафитить модель. то есть, я просто логарифмирую левую и правую сторону, получаю ln(y) = ln(b0) + b1*ln(x). и вот мне интересно, можно ли как-то этот ln(b0) включить в модель
b0 в преобразованном варианте будет отличаться от изначального, просто фитьте, скорее всего там и будет ln(b0), проверьте на каком-нибудь примере лучше, я не соображаю сейчас
источник

A

Andrey in R language and Statistical data analysis
производная от x^b1 по b1 равна x^b1*ln(x), то есть в производной от функции потерь все равно b1 в показателе степени останется
источник

MS

Maria Servetnik in R language and Statistical data analysis
Andrey
не могу сходу пояснить, но это работать не будет, т.к. модель  y = b0*x^b1 не является линейной по параметрам
если будет время позднее пояснить, я буду очень благодарна! у меня в курсе это как раз пример того, как можно некоторые не линейные функции фитить lm'ом, если можно лог (например) преобразованием представить их как линейные, вот как в этом примере
источник

A

Andrey in R language and Statistical data analysis
не, то я напутал, для этого случая все хорошо. Вот пример http://jblomo.github.io/datamining290/slides/2013-04-19-Nonlinear.pdf
Это если бы под логарифмом сумма была, тогда бы ничего не получилось
источник

👁

👁 in R language and Statistical data analysis
а вообще lm и занимается подбором оптимальных коэффициентов в зависимости от параметров и если какой-либо коэффициент регулируешь, то другой изменится, а модель можно какую угодно делать, главное точность
источник

a

aGricolaMZ in R language and Statistical data analysis
Philipp Upravitelev
я косвенно
организатор - Ира Голощапова из X5
а почему митапы в Москве имеют какой-то крен в бизнес? Прошлогодний по-моему, тоже какой-то такой же...
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
aGricolaMZ
а почему митапы в Москве имеют какой-то крен в бизнес? Прошлогодний по-моему, тоже какой-то такой же...
не всегда. как-то Демешев рассказывал про STAN, Иванчей про линейные модели говорил и т.д.
но, в целом, потому что основная аудитория этих митапов - все же ребята из бизнеса. ну и докладчиков проще там искать, Ира с академическим миром слабо связана.

кстати. если ты хочешь что-то рассказать - она будет рада, ей как раз докладчик нужен вроде бы :)
про те же карты языков, например
источник

a

aGricolaMZ in R language and Statistical data analysis
ну, я могу рассказать про написание пакетов и ropensci
источник