Size: a a a

AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

2021 May 25

ЯН

Ярослав Н in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Спасибо большое
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ребят, поскадите чат по математике пожалуйста
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Привет,
В торче и ТФ у батчнормы есть параметр моментум.
На основе какой статьи или материала он используется в разных имплементациях ?

У меня батч норм = 1 (так ограничен алгоритм в данном виде),
я нашел эту статью: https://www.ecva.net/papers/eccv_2020/papers_ECCV/papers/123570222.pdf

которая говорит в целом о проблематичности батча размером в 1 в контексте батч нормы, и предлагает MBN,
Momentum Batch Norm, задумался, а не то ли это, что есть в торче, тф и т.д ?

Что еще можете сказать полезного про сетку с батчнормами и батчем размером в 1 ?

в статье даже пишется что это "open problem".
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
например, в торче.

В данной конвенции, правильно ли я понимаю, что при батче в 1, логичнее попробовать  уменьшить моментум, чтобы история влияла больше а каждый noisy sample с его noisy variance меньше ?
источник

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Возьми любую другую нормальзацию?
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
как вариант. Просто бейслайн для определенных результатов у выше стоящих именно с такой сеткой,
они пока с меньшим энтузиазмом рассматривают вариант смены сетки, но корректировка архитектуры тут в тему да.

Еще им кажется, что валидацию в трейн моде делать норм, что для меня совсем криво, я не прав ?
Или так можно ? То есть с дропаутами и с аккамулцией статистики теста в сетку (то есть небольшое статическое жульничество в моем понимание).
источник

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
можно но не нужно
источник

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Дропаут будет ухудшать результат, бн вроде будет работать чуть лучше. Но чтобы проверить точность лучше иметь фиксированную систему.
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
ну так в том и тема теста, это то мне понятно. Думаю над самым приемлемым для всех вариантом.

Просто вот у нас архитектура mobilenet v2 допустим, плюс pretrained.
1. имеет смысл вообще брать претрейнд, поменять batchnorm на instancenorm ?
2. забьем на претрейнд, что будет с mobilenet в целом заменив btachnorm  на instancenorm ?
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
то есть и бейслайн меняется, хз лучше хуже
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
поэтому думаю может моментумом все исправится
источник

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Вроде если перенести параметры bn на in, то замороженные для одного батча они будут работать идентично. Вот если в train режим их поставить на бс 1, то думаю тоже норм будет
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
такой вариант был озвучен, с заморозкой. Но как раз последнее: 'если в train режим их поставить на бс 1, то думаю тоже норм будет' - не дает результатов.

Натренированная с batch допустим 20, потом на 1 на тренировочном сете дает хорошие результаты, а на валлидации плохие.
источник

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
на бетче 1 вообще кажется довольно больно тренировать
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
довольно таки да и по времени, но пока этот вариант приоритетнее (не для меня, но для тех кто решает больше чем я)
источник

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Аккумулировать Вам надо, молодой человек.
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
ну вот акамуляция с одной точки зрения это моментум.
а со второй это как раз:
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
у меня такая аккумуляция кстати вроде как и работала
источник