Телеграмм чат группы datasciencechat страница 7111

Всем привет.
Мне нужно натренировать 3 модели последовательно.
Хочу попробовать так:
1) Модель 1 проходит кросс-валидацию из 10 фолдов. Предикт каждого тестового фолда сохраняется. Получаем датасет такого же объёма, но который был постороен только на данных валидации, без данных тренировки.
2) Кормим сгенерированный датасет второй модели таким же способом, разбивая на 10 фолдов и формируем датасет для 3-й модели.

источник

16:07пожаловаться #8

Dmitry in Data Science Chat

Что можете сказать о таком подходе?

источник

16:07пожаловаться #9

🐙

🐙 in Data Science Chat

По тому, как вы описали, у вас будет не три датасета, а три таргета.

источник

16:12пожаловаться #10

🐙

🐙 in Data Science Chat

Если обучать вторую модель на предиктах первой, то, я предположу, ошибка будет ~ошибка первой модели * ошибка второй модели

источник

16:13пожаловаться #11

Dmitry in Data Science Chat

Предикты моделей смешиваются с входящими данными в первую модель. Я таким образом хочу избежать лика по тренировочным данным.

источник

16:14пожаловаться #12

ВК

Вячеслав Колосков... in Data Science Chat

а чем обычный стэкинг не устраивает?

источник

16:15пожаловаться #13

Dmitry in Data Science Chat

сильное переобучение
ищу способы решения

источник

16:15пожаловаться #14

ВК

Вячеслав Колосков... in Data Science Chat

почему вы думаете что ваш метод будет меньше переобучаться?

источник

16:18пожаловаться #15

ВК

Вячеслав Колосков... in Data Science Chat

помоему это тоже стекинг, только более хитрый

источник

16:18пожаловаться #16

Dmitry in Data Science Chat

потому что следующие модели не будут видеть предсказания на тренировочных данных вообще
у меня не несколько параллельных моделей с одним мета-учеником, а подряд модели, которые кормят все данные одна в другую

источник

16:22пожаловаться #17

ВК

Вячеслав Колосков... in Data Science Chat

так при стэкинге метаалгаритм тоже не должен видеть предсказаний на тренировочных данных

источник

16:23пожаловаться #18

Dmitry in Data Science Chat

да, но разве при этом не теряется часть данных?

источник

16:25пожаловаться #19

ВК

Вячеслав Колосков... in Data Science Chat

может теряться а может и нет. смотря как построите обучние

источник

16:25пожаловаться #20