Телеграмм чат группы ru_deep

Ну работать удаётся с амплитудным спектром, а фаза теряется. Восстанавливать ее сложно. Плюс спектрограмма это спектр от окна скользящего по времени то есть это аппроксимация реальной функции которую мы слышим

источник

23:50пожаловаться #8

IU

Ivan U in Глубинное обучение (группа)

Evgenii Makarov

Ну работать удаётся с амплитудным спектром, а фаза теряется. Восстанавливать ее сложно. Плюс спектрограмма это спектр от окна скользящего по времени то есть это аппроксимация реальной функции которую мы слышим

Ещё само окно уменьшают. Вот как человек слушает: идёт песня последовательно, допустим 3 минуты, мы отмечаем для себя что-то что уже слышали раньше, какие-то похожие вещи, и далее делаем вывод что вот эта песня похожа на песню, которую слышал ранее, в том и в том. А те сети которые я смотрел в работах, память не содержат. И вывод сделать не смогут такой.

источник

23:56пожаловаться #9

V

Val in Глубинное обучение (группа)

Evgenii Makarov

Ну работать удаётся с амплитудным спектром, а фаза теряется. Восстанавливать ее сложно. Плюс спектрограмма это спектр от окна скользящего по времени то есть это аппроксимация реальной функции которую мы слышим

Спектрограмма содержит достаточно информации, чтобы восстановить сигнал, при определенных довольно слабых требованиях на окно и размер хопа

источник

23:57пожаловаться #10

V

Val in Глубинное обучение (группа)

С точностью до знака

источник

23:57пожаловаться #11

YB

Yuri Baburov in Глубинное обучение (группа)

если не модуль амплитуды, то и со знаком тоже

источник

23:58пожаловаться #12

V

Val in Глубинное обучение (группа)

Ну речь шла об отсутствующей фазе, конечно, иначе все довольно легко

источник

23:58пожаловаться #13

EM

Evgenii Makarov in Глубинное обучение (группа)

Вы хотели сказать, модуль комплексной амплитуды?

источник

23:58пожаловаться #14

YB

Yuri Baburov in Глубинное обучение (группа)

не, скорее речь о том, что [ re(x) , im(x)] для нейросети — неудобное представление.
нужно что-то типа [re(x), re(x*pi/6), re(x*pi/3), ...] чтобы было получше.

источник

23:59пожаловаться #15

IU

Ivan U in Глубинное обучение (группа)

Я к тому что при маленьком окне и отсутствии памяти не получится даже мелодию запоминать. А ещё нужно извлекать мотив, ритм.

источник

23:59пожаловаться #16

YB

Yuri Baburov in Глубинное обучение (группа)

Ivan U

Я к тому что при маленьком окне и отсутствии памяти не получится даже мелодию запоминать. А ещё нужно извлекать мотив, ритм.

а кто ставит такие ограничения?