Посмотрел работу LassoCV, на примере задачки прогноза проката великов.
LassoCV проводит кросвалидацию, подбирает альфу для регуляризации, исходя из минимума ошибки на конкретном разбиении и конкретной тестовой выборке, и coef_ параметры на этом же разбиение считает лучшими, считает решением.
Я правильно описываю что делает LassoCV?
Понимаю, что LassoCV лучше, чем просто самому один раз разбить выборку и сделать Lasso – можно совсем не угадать )
Но пахнет подгонкой под конкретное разбиение, при том мы ищем это хорошее разбиение когда бьем k раз и перебираем.
Поправьте меня если я в чем-то не прав?
Если прав, то как на практике, грех подгонки случается или нет?