Телеграмм чат группы ds

Size: a a a

Data Science Kazakhstan (DS/ML kz)

2548 membersпожаловаться на группу

2020 June 04

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)

Рахмет за ссылку. И кажется логично, что embedding layer подключается для инита.

источник

19:35пожаловаться #1

Iv in Data Science Kazakhstan (DS/ML kz)

Почему рандомно? Веса инициализируются же известными методами Ксавье или Кайминь по умолчанию.

источник

19:42пожаловаться #2

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)

То есть bias самплится откуда-то ? Код - это хорошо видеть, но в целом картина

источник

19:42пожаловаться #3

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)

какое распределение ?

источник

19:42пожаловаться #4

Iv in Data Science Kazakhstan (DS/ML kz)

Bias можно инициализировать консатной вроде, если без изысков

источник

19:43пожаловаться #5

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)

Откуда люди знают значения и отлично ли оно самое от модели к модели

источник

19:43пожаловаться #6

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)

Почему рандомно? Веса инициализируются же известными методами Ксавье или Кайминь по умолчанию.

Ксавье ж это слуайно выбранное из норм распределения нет?

источник

19:43пожаловаться #7

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)

Сходства и различия

источник

19:43пожаловаться #8

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)

из равномернго

источник

19:43пожаловаться #9

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)

То есть все начальные константы либо из равномерного или из нормального

источник

19:44пожаловаться #10

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)

Ксавье из равномерного

источник

19:44пожаловаться #11

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)

init_weights = uniformly distributed bias + embedding

источник

19:44пожаловаться #12

Iv in Data Science Kazakhstan (DS/ML kz)

Rauan Akylzhanov

То есть все начальные константы либо из равномерного или из нормального

Да, почти всегда так инициализируют биас

источник

19:45пожаловаться #13

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)

Если я возьму времена на pre-trainigs, t1 t2 t3

источник

19:46пожаловаться #14

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)

ti-tj = 1e+n ?

источник

19:46пожаловаться #15

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)

n = ?

источник

19:46пожаловаться #16

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)

Разный номер для разной модели

источник

19:47пожаловаться #17

Rauan Akylzhanov in Data Science Kazakhstan (DS/ML kz)

Да, почти всегда так инициализируют биас

Спасибо

источник

19:47пожаловаться #18

Taskynov Anuar in Data Science Kazakhstan (DS/ML kz)

Есть такая прикольная статья про инициализацию:
papers.nips.cc/paper/9427-metainit-initializing-learning-by-learning-to-initialize

papers.nips.cc

MetaInit: Initializing learning by learning to initialize

Electronic Proceedings of Neural Information Processing Systems

источник

19:47пожаловаться #19

Taskynov Anuar in Data Science Kazakhstan (DS/ML kz)

Но она для CV.) было бы прикольно попробовать для NLP Transformers.

источник

19:48пожаловаться #20