разобрался, там несколько траспозов, просто действительно размер батча первым идет а потом умножение матриц, измерения как принято m*n и n*p должно быть, все как написано )
привет. есть изображения300*300, 77к шт, нужно классифицировать на 2 класса. какую архитектуру лучше всего использовать? я накидал там рандомно грубо говоря, вышло не очень) она спустя 46/72 эпох топчется на месте с ошибкой 0.5
привет. есть изображения300*300, 77к шт, нужно классифицировать на 2 класса. какую архитектуру лучше всего использовать? я накидал там рандомно грубо говоря, вышло не очень) она спустя 46/72 эпох топчется на месте с ошибкой 0.5