Телеграмм чат группы comput_math страница 175

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

comput.math

339 membersпожаловаться на группу

2018 June 16

GC

Great Cheese Wall in comput.math

С холмами даже в чем то лучше, так как есть методы, которые как бы добавляют "инерцию" шарику, чтоб он мог перескочить локальный минимум и все такое

источник

19:57пожаловаться #1

V🇺

Vladislav 🇺🇸🚜🇷🇺 in comput.math

потом конечно рассмотрю по ближе, что бы лучше понимать, как избегать оверфиттинга.

оверфиттинг - скорее свойство модели, а не метода оптимизации, не?

источник

19:58пожаловаться #2

AB

Anton Burkin in comput.math

Vladislav 🇺🇸🚜🇷🇺

оверфиттинг - скорее свойство модели, а не метода оптимизации, не?

источник

19:58пожаловаться #3

AB

Anton Burkin in comput.math

оверфиттинг на сколько мне объяснили происходит из за того, что в процессе обучения градиент уходит не в тот минимум =)

источник

19:59пожаловаться #4

AB

Anton Burkin in comput.math

но я только начал изучать недавно это дело

источник

20:00пожаловаться #5

V🇺

Vladislav 🇺🇸🚜🇷🇺 in comput.math

оверфиттинг на сколько мне объяснили происходит из за того, что в процессе обучения градиент уходит не в тот минимум =)

Сомнительное утверждение, имхо - это как минимум только одна из возможностей

источник

20:00пожаловаться #6

AB

Anton Burkin in comput.math

так что может не так понял человека, объяснявшего мне =)

источник

20:00пожаловаться #7

g

gsomix in comput.math

Можно поиграться, кстати, со спуском и моментами.

https://distill.pub/2017/momentum

Why Momentum Really Works

We often think of optimization with momentum as a ball rolling down a hill. This isn't wrong, but there is much more to the story.

источник

20:00пожаловаться #8

AB

Anton Burkin in comput.math

источник

20:00пожаловаться #9

V🇺

Vladislav 🇺🇸🚜🇷🇺 in comput.math

если модель достаточно мощная чтобы просто запомнить ответы на все training examples - это тоже overfitting, например

источник

20:00пожаловаться #10

AB

Anton Burkin in comput.math

Vladislav 🇺🇸🚜🇷🇺

если модель достаточно мощная чтобы просто запомнить ответы на все training examples - это тоже overfitting, например

угу, тоже знаю про это.

источник

20:00пожаловаться #11

V🇺

Vladislav 🇺🇸🚜🇷🇺 in comput.math

все так)

источник

20:00пожаловаться #12

AB

Anton Burkin in comput.math

угу, я просто проорал =)

источник

20:01пожаловаться #13

AB

Anton Burkin in comput.math

на столько жиза

источник

20:01пожаловаться #14

AB

Anton Burkin in comput.math

сижу на работе, меняю алгоримы, количество&размерности слоёв, функции активации/потерь/оптимизации и размерность батча... После чего пялюсь на грифик =)

источник

20:02пожаловаться #15

AB

Anton Burkin in comput.math

и пока что это происходит на 95% рандомно и 5% предположений =)

источник

20:02пожаловаться #16

V🇺

Vladislav 🇺🇸🚜🇷🇺 in comput.math

самое обидное - когда рандомное работает лучше чем по предположениям

источник

20:06пожаловаться #17

AB

Anton Burkin in comput.math

я пока что не совсем понимаю, от чего всё это дело пляшет =)

источник

20:08пожаловаться #18

AB

Anton Burkin in comput.math

базис из книги принял к сведению, но вот не более пока что

источник

20:08пожаловаться #19

EZ

Evgeniy Zheltonozhskiy🇮🇱 in comput.math

и пока что это происходит на 95% рандомно и 5% предположений =)

значит можно заменить тебя на random search

источник

20:08пожаловаться #20