Или я не понимаю, что происходит >А на новых данных, где истинного значения нет, на что множить будешь? А потом ты говоришь про логарифмирование, обратное преобразование
Я пытаюсь объяснить почему он таки может быть отрицательный Вот говорю: если есть мнк, то у нас y=y^+eps И D(y)=D(y^)+D(eps) R2=D(y^)/D(y)=1-D(eps)/D(y) Вот если по второй формуле считать и если МНК проведен неправильно, то, возможно, получится D(y)=D(y^)+D(eps)+2cov(y^,eps) А тогда D(y)-D(eps)=D(y^)+2cov(y^,eps) И наш R2 получится [D(y^)+2cov(y^,eps)]/D(y)
только сейчас задумался- кажется у меня фундаментальное непонимание темы - в задаче регрессии мы модели должны дать значения ровно того же количества фичей, чтобы получить результат или же можно подать меньшее коичество фичей? то есть модель мы например обучали на 10 колонках, а подаем ей всего 5 и хотим получить оценку.
Есть Задача регресии с несколькими выходами. По пяти значениям (x, y, z, x_vel, y_vel) предсказывать 4 другие (alpha, beta, z_vel, delay) Подскажите какой ml алгоритм/подход здесь уместен?
(y1, y2, y3) = f(x1, x2, x3, x4, x5), обычно и часто f это отдельные f1, f2, f3, на стартовом уровне. если нейросетки или randomforest какой, то там можно вектор
Ну при обучении можно применять импутинг (замену пропущенных значений), никто не мешает подобные техники применять и при получении предсказаний, вопрос в качестве