Телеграмм чат группы bigdata

У них, как я понял, идея в том, что запрос идёт от большего разрешения к value прошлого разрешения... Интересно, советую посмотреть ещё TransGAN, они делают upsampling с помощью depth to space и используют трансформеры.

у них на выходе сначала один linear, потом двойной в виде mlp.

источник

03:00пожаловаться #4

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Vadim Chashechnikov

https://github.com/heykeetae/Self-Attention-GAN/blob/master/sagan_models.py

GitHub

heykeetae/Self-Attention-GAN

Pytorch implementation of Self-Attention Generative Adversarial Networks (SAGAN) - heykeetae/Self-Attention-GAN

а у этого только linear помоему

источник

03:00пожаловаться #5

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Ilya

а у этого только linear помоему

Посмотри код, там двойное линеар с релу.

источник

03:00пожаловаться #6

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Vadim Chashechnikov

Посмотри код, там двойное линеар с релу.

где ?

источник

03:01пожаловаться #7

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Ilya

где ?

last тоже не содержит mlp

источник

03:02пожаловаться #8

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Ilya

где ?

это Генератор

источник

03:02пожаловаться #9

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

attention у него и дальше конволюции обычные, для decoding аттенншеного нойза (точнее разфичеренего нойза, не важно)

источник

03:03пожаловаться #10

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Ilya

это Генератор

В диксриминаторе также.

источник

03:04пожаловаться #11

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Имел в виду, что свертки как линейный слой.

источник

03:05пожаловаться #12

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Vadim Chashechnikov

Имел в виду, что свертки как линейный слой.

ну так свертки с кернел сайз 4 это не ФС. Это обычный дальнейший декодинг нойза в картинку.

источник

03:05пожаловаться #13

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Поэтому как бы и рождаются три варианта, без, с одним как в статье САГАНА, или как в трансформерах, в декод-слое, потом еще с двойным ФС.

источник

03:06пожаловаться #14

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Тоже являются линейным выражением, только с ограниченным полем действия.

источник

03:06пожаловаться #15

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Vadim Chashechnikov

Тоже являются линейным выражением, только с ограниченным полем действия.

понятно, но там можно убрать аттеншен, и обычный ГАН.

источник

03:07пожаловаться #16

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Ilya

понятно, но там можно убрать аттеншен, и обычный ГАН.

убрать, значит оставить свертки как есть, только без attn

источник

03:07пожаловаться #17

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Vadim Chashechnikov

Тоже являются линейным выражением, только с ограниченным полем действия.

но я понял, что ты имеешь ввиду, типо они последовательны,"типо" схожий эффект.

источник

03:08пожаловаться #18

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Без, думаю, работать не будет, в сагане у тебя сначала пародия на обычный линейный conv1x1, но после и более мощный transpose convolution. В обычном трансформере тоже самое, только без inductive bias локальности.

источник

03:08пожаловаться #19

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Vadim Chashechnikov

ну мне кажется conv там потому из-за общих причин почему conv а не linear, а трансопзнутый, потому что мы нойз с маленьким измерением выращиваем в картинку, то есть это по сути декодер для нойза, изучающий distribution фичеров картинки. А декодер это ConvolutionalTransposeNet по сути.
На счет траснформера не понял мысль, зачем там двойной слой MLP?

источник

03:11пожаловаться #20