Телеграмм чат группы bigdata_ru страница 2129

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

4346 membersпожаловаться на группу

2020 July 27

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Vadim Chashechnikov

Тем временем, у меня с этим видом свертки batchnorm2d даёт 1 для weights и 0 для bias 0_0 для не pretrained сети. И при этом взрыв forward pass через nan. Хотя mean увеличивается и std увеличивается. Соответственно, вывод что batchnorm просто отказывается работать и шлёт меня на 3 буквы. Пробовал track_running_stats=False (вдруг там какой-то баг с eval). Все равно 1 0. Как это вообще фиксить?

1 это что?

источник

14:14пожаловаться #1

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Evgenii Zheltonozhskii🇮🇱

1 это что?

1 - это вес батчнорма, 0 - это bias

источник

14:15пожаловаться #2

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Vadim Chashechnikov

1 - это вес батчнорма, 0 - это bias

А в чем проблема

источник

14:16пожаловаться #3

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Может у тебя affine=false?

источник

14:16пожаловаться #4

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Надо трекать стд и среднее ж а не афинные параметры

источник

14:16пожаловаться #5

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Evgenii Zheltonozhskii🇮🇱

Может у тебя affine=false?

affine=True

источник

14:17пожаловаться #6

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Vadim Chashechnikov

affine=True

Ну ок, но все равно почему тебя аффинные параметры волнуют, тут проблема скорее с std

источник

14:18пожаловаться #7

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Evgenii Zheltonozhskii🇮🇱

Надо трекать стд и среднее ж а не афинные параметры

Да прикол в том, что если аффинные параметры 0 и 1, то явно он ничего делать не хочет.

источник

14:18пожаловаться #8

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Vadim Chashechnikov

Да прикол в том, что если аффинные параметры 0 и 1, то явно он ничего делать не хочет.

Мб распределение фич сильно разное между бетчами?

источник

14:20пожаловаться #9

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Vadim Chashechnikov

Тем временем, у меня с этим видом свертки batchnorm2d даёт 1 для weights и 0 для bias 0_0 для не pretrained сети. И при этом взрыв forward pass через nan. Хотя mean увеличивается и std увеличивается. Соответственно, вывод что batchnorm просто отказывается работать и шлёт меня на 3 буквы. Пробовал track_running_stats=False (вдруг там какой-то баг с eval). Все равно 1 0. Как это вообще фиксить?

Погоди а с track тоже расходится?

источник

14:20пожаловаться #10

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Evgenii Zheltonozhskii🇮🇱

Погоди а с track тоже расходится?

Не понял вопроса. Я не использую hook. Вывожу простым принтом. Прикол в том, что я не могу сделать даже один проход, на каком-то layer он просто взрывается. При этом видно, что нарастание происходит с самого первого слоя.

источник

14:26пожаловаться #11

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Vadim Chashechnikov

Не понял вопроса. Я не использую hook. Вывожу простым принтом. Прикол в том, что я не могу сделать даже один проход, на каком-то layer он просто взрывается. При этом видно, что нарастание происходит с самого первого слоя.

Если выключить track_running_stats все равно наны?

источник

14:27пожаловаться #12

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Вообще, в официальной репе это обещали фиксить дельтами в std, чтобы не было умножения на 0. И даже есть такие вот issue: https://github.com/joe-siyuan-qiao/WeightStandardization/issues/1.

Questions about the definition of WS and a possible typo in the paper. · Issue #1 · joe-siyuan-qiao/WeightStandardization

Thank you for sharing a very nice paper! I have a couple of small questions about the definition of WS. My first question is about a possible typo in the paper (based on the initial version of http...

источник

14:27пожаловаться #13

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Evgenii Zheltonozhskii🇮🇱

Если выключить track_running_stats все равно наны?

+

источник

14:27пожаловаться #14

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Vadim Chashechnikov

+

А пример вывода можно?

источник

14:28пожаловаться #15

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

источник

14:28пожаловаться #16

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Такой же

источник

14:28пожаловаться #17

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Vadim Chashechnikov

Такой же

Ну ты понимаешь что если ты делишь бетч на стд бетча должен быть стд 1?

источник

14:29пожаловаться #18

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Evgenii Zheltonozhskii🇮🇱

Ну ты понимаешь что если ты делишь бетч на стд бетча должен быть стд 1?

Угу

источник

14:29пожаловаться #19

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

И проблема значит, что batchnorm2d не работает, если мы используем эту свёртку.

источник

14:30пожаловаться #20