Size: a a a

AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

2021 May 26

D•

Dan • Captain in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
оптимальной нет. самое смешное, что метод ПИО с математической точки зрения работает наиболее идеально. объяснить не можем :)
источник

DK

Danil Kalinin in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Можно еще NAS попробовать.
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
ПИО - аббр ?
проб и ошибок ))?
ПИО 😂
источник

D•

Dan • Captain in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Оно :)
источник

SL

Sergey L in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Попробовал И Офигел ;)
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
😆
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ок ..
источник

VB

Vladimir Bazilevich in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
А что есть NAS?
источник

DK

Danil Kalinin in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Neural Architecture Search
источник

VB

Vladimir Bazilevich in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Спасибо, почитаю на досуге
источник
2021 May 27

TN

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Вы, кстати, уверены, что полностью знаете, как работает батч норм? Я полгода назад выяснил, что я неправильно его понимал на самом деле. Если PyTorch, то надо понимать, как на батч норм влияют: affine True or False, track_running_stats True or False, .train() и .eval() режимы. А также как работает momentum=None и momentum=0.9 (или любая другая ненулевая константа).
источник

TN

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Вообще, в Вашей задаче самое главное это добиться эквивалентности обучения с батчем 1, и, например 20, только для .train() режима. А сделать это непросто, если это ещё не написали до вас
источник

TN

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
И через momentum аргумент у батч норма это не решить - градиенты по статистикам учитываться не будут
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
ну я примерно на том же остановился, посмотрел его форвард, увидел что статистики оказывается собираются в нем, а не в бэкварде (мне как то второе было более интуитивно), но пока что пробую избежать вообще тренировки в batchsize=1 mode.  

На самом деле оно и не должно работать с батчом в размер 1, даже возможно с аккамуляцией (у меня там возможно улучшало за счет другой технической фишки, которая скорее баг, чем закономерность).  

Но возможно и не придется, пока рано сказать. До старших дошло, что лучше повозиться с тем, как увеличить батч в том алгоритме.
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
не очень понимаю, почему в трейн моде работало.
источник

TN

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
У вас ограничение по памяти, или принципиальное, в лоссе/модели?
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
но да надо его от А до Я изучить
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
в модели, там в статье тоже сигнл батч, и достаточно тоже не тривиально будет ли работать в мульти батче.
источник

TN

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
У Вас pytorch?
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
да
источник