и ещё вопрос по оценкам максимального правдоподобия в линейной регрессии. Если мы предполагаем, что eps_i ~ N(0, sigma^2), то получаем log-likelihood вида:
-nln(sigma) - 1/2sigma^2 * ||y - Xa||^2
Почему-то утверждается, что его можно в 2 шага максимизировать: сначала разобраться с ||y - Xa|| (минимизировать), а затем уже при фиксированной a искать sigma