Просто в статьях чуток любят приукрашивать сейчас, а люди время тратят на воспроизведение результатов и не получается. Вот у меня недавно один знакомый сделал LPCNet потом долго гадал, как от шума избавиться.
Там в репозитории сама сетка изи переписывается Если принять их пре-процессинг за блек бокс, то даталоадер тоже изи, просто возни много А такотрон пишут что заводится на их фичах
Да на родном керасе, не в этом суть. В lpcnet тяжело pitch предсказать правильно, я так понял. Вообще модельки с тоном это так себе, вот даже в китайском калди отказались.
А различие нейро обработки шумов от алгоритмических сильно заметно?
По первому впечатлению - только в скорости работы. Всякие logmmse по скорости даже рядом не стоят. На моём i5 RNNoise даёт примерно 25 реалтаймов, а logmmse сильно меньше