Всем привет!
Я немного эпизодически читаю чат, если такая дискуссия уже была или где-то лежит хороший ответ на этот вопрос — ткните меня туда, пожалуйста, беглый гуглинг пока не очень меня устроил.
Вопрос про многофакторную анову и границы ее применения. Можно ли делать несколько отдельных тестов по уровням одного из факторов, и если да, то почему, и если нет -- тоже почему?
Подробнее: допустим, есть зависимая переменная Y, для которой варировались три фактора: фактор A с уровнями a1 и a2, фактор B с уровнями b1 и b2 и фактор C с уровнями c1 и c2.
Если я хочу посмотреть, как эти факторы влияли на Y, я базово делаю 2 (A: a1,a2) х 2 (B: b1,b2) х 2 (C: c1,c2) ANOVA для Y (1)
Дает ли что-то нам право посчитать два теста отдельно, скажем, по уровням фактора B: отобрать отдельно данные из датасета, где B==b1 и где B==b2, и сделать отдельно 2 (A: a1, a2) х 2 (C: c1, c2) ANOVA для Y, где B==b1, и 2 (A: a1, a2) х 2 (C: c1, c2) ANOVA для Y, где B==b2 (2).
Первый вариант (1) более жесткий к данным, и при последующем пост-хоке поправка на множественные сравнения будет сильнее, потому что сравнений больше. Во втором варианте (2) мы, соответственно, искусственно уменьшаем количество сравнений, и считаем на самом деле зависимые данные как независмые, но однозначно ли это плохо? В вопросе, почему нужно обязательно делать (1) а не (2), у меня не хватает уверенности и аргументации :(