Извиняйте за спам.
есть следующая запись dy_vec / dW, где y_vec - вектор размерностью (2х1), а в W - квадратная матрица размерностью 2х2, при этом y(1) = w(11) * x(11) + w(12) * x(21) + b(11),
а y(2) = w(21) * x(11) + w(22) * x(21) + b(21).
(x - вектор 2х1, b - вектор 2х1)
Верно ли я понимаю, что запись dy_vec/dW означает взятие производной от каждого элемента вектора y_vec по каждому элементу матрицы W? То есть конкретно в данном случае размерность dy_vec/dW будет (2х4)?
Или производная y(1) по w(21) и w(22) даже браться не будет? (Так-то там нули получаются, поскольку w(21) и w(22) даже не присутствуют в выражении для y(1)). Заранее большое спасибо