Никто не знает, почему при обучении нейронки может использоваться видеопамять, но не вычислительные способности видюхи? Tensorflow с cuda работает и gpu видит, но не использует нормально
у кого-нибудь бывало такое, что новая придуманная фича сразу прорывалась на 2-3 место по важности? и при этом она никак не была связана с предыдущими, то есть была добавлена чисто из здравого смысла?
Я думал, что проблема может быть в обработке последовательностей. Lstm же требует условий для корректной работы на gpu, возможно gru имеет схожие требования, не особо знаю, как там внутри процесс идёт