Size: a a a

Data Science Kazakhstan (DS/ML kz)

2020 June 04

RA

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)
250 миллионов параметров, верно?
источник

RA

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)
И я рандомно получается выставляю веса, верно?
источник

RA

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)
Я спрашиваю гипотетический метод одинаков везде или принципиально отличен
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
Вообще не эксперт в НЛП, но в BERT вроде же есть инициализация весов. pseudo-random initialization
источник

RA

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)
Iv ?
источник

RA

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)
Пользователь Iv ?
источник

RA

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)
Renat Alimbekov
Вообще не эксперт в НЛП, но в BERT вроде же есть инициализация весов. pseudo-random initialization
Рахмет.
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
Rauan Akylzhanov
Пользователь Iv ?
@il_bison тя зовут
источник

RA

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)
@il_bison если можете облегчить страдания и принести чуток enlightenment 😂
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
def _init_weights(self, module):
   """ Initialize the weights """
   if isinstance(module, (nn.Linear, nn.Embedding)):
       # Slightly different from the TF version which uses truncated_normal for initialization
       # cf https://github.com/pytorch/pytorch/pull/5617
       module.weight.data.normal_(mean=0.0, std=self.config.initializer_range)
   elif isinstance(module, BertLayerNorm):
       module.bias.data.zero_()
       module.weight.data.fill_(1.0)
   if isinstance(module, nn.Linear) and module.bias is not None:
       module.bias.data.zero_()
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
def _init_weights(self, module):
       """ Initialize the weights.
       """
       if isinstance(module, (nn.Linear, nn.Embedding, Conv1D)):
           # Slightly different from the TF version which uses truncated_normal for initialization
           # cf https://github.com/pytorch/pytorch/pull/5617
           module.weight.data.normal_(mean=0.0, std=self.config.initializer_range)
           if isinstance(module, (nn.Linear, Conv1D)) and module.bias is not None:
               module.bias.data.zero_()
       elif isinstance(module, nn.LayerNorm):
           module.bias.data.zero_()
           module.weight.data.fill_(1.0)
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
gpt2
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
def _init_weights(self, module):
       """ Initialize the weights.
       """
       if isinstance(module, (nn.Linear, nn.Embedding)):
           # Slightly different from the TF version which uses truncated_normal for initialization
           # cf https://github.com/pytorch/pytorch/pull/5617
           module.weight.data.normal_(mean=0.0, std=self.config.initializer_range)
           if isinstance(module, nn.Linear) and module.bias is not None:
               module.bias.data.zero_()
       elif isinstance(module, XLNetLayerNorm):
           module.bias.data.zero_()
           module.weight.data.fill_(1.0)
       elif isinstance(module, XLNetRelativeAttention):
           for param in [
               module.q,
               module.k,
               module.v,
               module.o,
               module.r,
               module.r_r_bias,
               module.r_s_bias,
               module.r_w_bias,
               module.seg_embed,
           ]:
               param.data.normal_(mean=0.0, std=self.config.initializer_range)
       elif isinstance(module, XLNetModel):
           module.mask_emb.data.normal_(mean=0.0, std=self.config.initializer_range)
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
xlnet
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
ну общие вещи явно есть)
источник

RA

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)
Круто. conda yml есть, мне нужно потыкать, что именно делает module.bias.data
источник

RA

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)
keras-gpt-2
источник

RA

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)
keras-xlnet ?
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
Нет пайторчевые
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
источник