Телеграмм чат группы ru_deep

да. какая-то точка будет больше других похожа на часть глаза и будет иметь больший градиент, чем другие точки (даже если отрицательный)
в следующий раз после fprop+bprop она будет наверняка иметь ещё больший градиент

источник

20:18пожаловаться #3

ID:347198853 in Глубинное обучение (группа)

источник

20:19пожаловаться #4

ID:347198853 in Глубинное обучение (группа)

они говорят что шум должен быть не полностью случайным, а статистически похожим на натуральный image

источник

20:20пожаловаться #5

ID:347198853 in Глубинное обучение (группа)

Yuri Baburov

не совсем понимаю что ты имеешь в виду под "в следующий раз после fprop+bprop она будет наверняка иметь ещё больший градиент"

источник

20:23пожаловаться #6

Yuriy Turchin in Глубинное обучение (группа)

Ну мы же обучим картинку, следовательно та часть которая была похожа на глаз, станет еще больше похожа на глаз

источник

20:24пожаловаться #7

Yuriy Turchin in Глубинное обучение (группа)

видимо так

источник

20:24пожаловаться #8

Yuri Baburov in Глубинное обучение (группа)

да

источник

20:24пожаловаться #9

ID:347198853 in Глубинное обучение (группа)

но чем больше картинка похожа на глаз, тем меньше ее нужно менять, а следовательно, тем меньше градиент

источник

20:25пожаловаться #10

ID:347198853 in Глубинное обучение (группа)

разве не так?

источник

20:26пожаловаться #11

Yuri Baburov in Глубинное обучение (группа)

в смысле если fprop и так даёт (0 0 ... 0 0.99 0 ... 0 0 ) ?

источник

20:27пожаловаться #12

ID:347198853 in Глубинное обучение (группа)

да

источник

20:28пожаловаться #13

Yuri Baburov in Глубинное обучение (группа)

да, если bprop не имеет exploding gradients , то да.

источник

20:28пожаловаться #14

ID:347198853 in Глубинное обучение (группа)

градиент будет больше только если картинку нужно менять сильно, и мы используем моментум

источник

20:29пожаловаться #15

Yuri Baburov in Глубинное обучение (группа)

т.е. если где-то есть уже глаз, то всё, изменения закончатся.
а иначе могут "вырасти" несколько глаз одновременно.

источник

20:29пожаловаться #16

ID:347198853 in Глубинное обучение (группа)

ну да, либо "exploding chain"

источник

20:30пожаловаться #17

Yuri Baburov in Глубинное обучение (группа)

ID:347198853

градиент будет больше только если картинку нужно менять сильно, и мы используем моментум

от слоёв нейросети зависит. если ReLU -- то никогда не будет при стандартном learning rate порядка 0.001 даже при momentum = 0.99 , ибо (1+0.99+0.99*2+... ) * 0.001 = 0.1 .

источник

20:30пожаловаться #18

Yuri Baburov in Глубинное обучение (группа)

Yuri Baburov

а ещё можно этого избежать -- если поставить (0 0 .... 2 0 ... 0) на выходе

источник

20:31пожаловаться #19

ID:347198853 in Глубинное обучение (группа)

вообще-то про моментум я не прав был, там увеличивается update, а не gradient

источник

20:32пожаловаться #20