Size: a a a

Глубинное обучение (группа)

2017 May 25

NK

ID:347198853 in Глубинное обучение (группа)
Yuri Baburov
причём там, где уже было что-то похожее на глаза с т.з. нейросети
Насколько я понимаю, не обязательно. Можно начать даже с шума, и все равно в конце концов появятся глаза :)
источник

NK

ID:347198853 in Глубинное обучение (группа)
хотя насколько это сложно сделать на практике, я не знаю
источник

YB

Yuri Baburov in Глубинное обучение (группа)
ID:347198853
Насколько я понимаю, не обязательно. Можно начать даже с шума, и все равно в конце концов появятся глаза :)
да. какая-то точка будет больше других похожа на часть глаза и будет иметь больший градиент, чем другие точки (даже если отрицательный)
в следующий раз после fprop+bprop она будет наверняка иметь ещё больший градиент
источник

NK

ID:347198853 in Глубинное обучение (группа)
источник

NK

ID:347198853 in Глубинное обучение (группа)
они говорят что шум должен быть не полностью случайным, а статистически похожим на натуральный image
источник

NK

ID:347198853 in Глубинное обучение (группа)
Yuri Baburov
да. какая-то точка будет больше других похожа на часть глаза и будет иметь больший градиент, чем другие точки (даже если отрицательный)
в следующий раз после fprop+bprop она будет наверняка иметь ещё больший градиент
не совсем понимаю что ты имеешь в виду под "в следующий раз после fprop+bprop она будет наверняка иметь ещё больший градиент"
источник

YT

Yuriy Turchin in Глубинное обучение (группа)
Ну мы же обучим картинку, следовательно та часть которая была похожа на глаз, станет еще больше похожа на глаз
источник

YT

Yuriy Turchin in Глубинное обучение (группа)
видимо так
источник

YB

Yuri Baburov in Глубинное обучение (группа)
да
источник

NK

ID:347198853 in Глубинное обучение (группа)
но чем больше картинка похожа на глаз, тем меньше ее нужно менять, а следовательно, тем меньше градиент
источник

NK

ID:347198853 in Глубинное обучение (группа)
разве не так?
источник

YB

Yuri Baburov in Глубинное обучение (группа)
в смысле если fprop и так даёт (0 0 ... 0 0.99 0 ... 0 0 ) ?
источник

NK

ID:347198853 in Глубинное обучение (группа)
да
источник

YB

Yuri Baburov in Глубинное обучение (группа)
да, если bprop не имеет exploding gradients , то да.
источник

NK

ID:347198853 in Глубинное обучение (группа)
градиент будет больше только если картинку нужно менять сильно, и мы используем моментум
источник

YB

Yuri Baburov in Глубинное обучение (группа)
т.е. если где-то есть уже глаз, то всё, изменения закончатся.
а иначе могут "вырасти" несколько глаз одновременно.
источник

NK

ID:347198853 in Глубинное обучение (группа)
ну да, либо "exploding chain"
источник

YB

Yuri Baburov in Глубинное обучение (группа)
ID:347198853
градиент будет больше только если картинку нужно менять сильно, и мы используем моментум
от слоёв нейросети зависит. если ReLU -- то никогда не будет при стандартном learning rate порядка 0.001 даже при momentum = 0.99 , ибо (1+0.99+0.99*2+... ) * 0.001 = 0.1 .
источник

YB

Yuri Baburov in Глубинное обучение (группа)
Yuri Baburov
т.е. если где-то есть уже глаз, то всё, изменения закончатся.
а иначе могут "вырасти" несколько глаз одновременно.
а ещё можно этого избежать -- если поставить (0 0 .... 2 0 ... 0) на выходе
источник

NK

ID:347198853 in Глубинное обучение (группа)
вообще-то про моментум я не прав был, там увеличивается update, а не gradient
источник