ID:347198853
а вообще, у тебя есть интуиция насчет какие изменения модели помогают больше всего? Например, conv layers, or LSTM/GRU cells, or batchnorm, or more layers, etc?
вообще, я уже много экспериментов делал, LSTM > GRU > RNN, но и скорость сильно падает. Аналогично, ширина у LSTM и количество слоёв помогает, но при увеличении ширины падает скорость тренировки и увеличивается время обучения.