Size: a a a

Глубинное обучение (группа)

2017 July 12

KS

Konstantin Sozykin in Глубинное обучение (группа)
Dov
ребят кто то работал с распознованием музыки или стилей, есть у кого сурсы сожет скинете я посмотрю?
Бейслан на уровне фигак фигак делается
источник

IU

Ivan U in Глубинное обучение (группа)
Думаю, нормального качества все равно не получить. Из того что смотрел везде пытаются вытянуть что-то из спектра.
источник

YB

Yuri Baburov in Глубинное обучение (группа)
Ivan U
Думаю, нормального качества все равно не получить. Из того что смотрел везде пытаются вытянуть что-то из спектра.
ноты и аккорды хорошо распознаются, так что смотря какая задача
источник

V

Val in Глубинное обучение (группа)
Ivan U
Думаю, нормального качества все равно не получить. Из того что смотрел везде пытаются вытянуть что-то из спектра.
А в чем проблема со спектром работать?
источник

IU

Ivan U in Глубинное обучение (группа)
Там много ограничений обычно, типа полифония - нет, сложная электроника - нет
источник

IU

Ivan U in Глубинное обучение (группа)
Yuri Baburov
ноты и аккорды хорошо распознаются, так что смотря какая задача
Я читал в статьях что даже не 70%. Хотя может старые статьи.
источник

IU

Ivan U in Глубинное обучение (группа)
И не понятно как стиль или направление вынуть из нот и аккордов. Там же и ритм нужен, и какие-то типичные гармонии, и типовые инструменты.
источник

EM

Evgenii Makarov in Глубинное обучение (группа)
Val
А в чем проблема со спектром работать?
Ну работать удаётся с амплитудным спектром, а фаза теряется. Восстанавливать ее сложно. Плюс спектрограмма это спектр от окна скользящего по времени то есть это аппроксимация реальной функции которую мы слышим
источник

IU

Ivan U in Глубинное обучение (группа)
Evgenii Makarov
Ну работать удаётся с амплитудным спектром, а фаза теряется. Восстанавливать ее сложно. Плюс спектрограмма это спектр от окна скользящего по времени то есть это аппроксимация реальной функции которую мы слышим
Ещё само окно уменьшают. Вот как человек слушает: идёт песня последовательно, допустим 3 минуты, мы отмечаем для себя что-то что уже слышали раньше, какие-то похожие вещи, и далее делаем вывод что вот эта песня похожа на песню, которую слышал ранее, в том и в том. А те сети которые я смотрел в работах, память не содержат. И вывод сделать не смогут такой.
источник

V

Val in Глубинное обучение (группа)
Evgenii Makarov
Ну работать удаётся с амплитудным спектром, а фаза теряется. Восстанавливать ее сложно. Плюс спектрограмма это спектр от окна скользящего по времени то есть это аппроксимация реальной функции которую мы слышим
Спектрограмма содержит достаточно информации, чтобы восстановить сигнал, при определенных довольно слабых требованиях на окно и размер хопа
источник

V

Val in Глубинное обучение (группа)
С точностью до знака
источник

YB

Yuri Baburov in Глубинное обучение (группа)
если не модуль амплитуды, то и со знаком тоже
источник

V

Val in Глубинное обучение (группа)
Ну речь шла об отсутствующей фазе, конечно, иначе все довольно легко
источник

EM

Evgenii Makarov in Глубинное обучение (группа)
Вы хотели сказать, модуль комплексной амплитуды?
источник

YB

Yuri Baburov in Глубинное обучение (группа)
не, скорее речь о том, что [ re(x) ,  im(x)] для нейросети — неудобное представление.
нужно что-то типа [re(x), re(x*pi/6), re(x*pi/3), ...] чтобы было получше.
источник

IU

Ivan U in Глубинное обучение (группа)
Я к тому что при маленьком окне и отсутствии памяти не получится даже мелодию запоминать. А ещё нужно извлекать мотив, ритм.
источник

YB

Yuri Baburov in Глубинное обучение (группа)
Ivan U
Я к тому что при маленьком окне и отсутствии памяти не получится даже мелодию запоминать. А ещё нужно извлекать мотив, ритм.
а кто ставит такие ограничения?
источник

IU

Ivan U in Глубинное обучение (группа)
Железо
источник

YB

Yuri Baburov in Глубинное обучение (группа)
Evgenii Makarov
Вы хотели сказать, модуль комплексной амплитуды?
ага
источник

YB

Yuri Baburov in Глубинное обучение (группа)
Ivan U
Железо
я говорю, зависит от задачи.
источник