Телеграмм чат группы ru_deep_learning страница 145

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Глубинное обучение (группа)

219 membersпожаловаться на группу

2017 May 25

YB

Yuri Baburov in Глубинное обучение (группа)

я имел в виду 0.99**2 кстати.
не, всё правильно, при momentum update суммирует прошлые градиенты с весами.

источник

20:33пожаловаться #1

NK

ID:347198853 in Глубинное обучение (группа)

да, но сами градиенты от этого не меняются

источник

20:33пожаловаться #2

NK

ID:347198853 in Глубинное обучение (группа)

то есть они могут меняться, но не от этого

источник

20:33пожаловаться #3

YB

Yuri Baburov in Глубинное обучение (группа)

а, ну да. в смысле, нужно отдельно проговаривать, как мы картинку меняем -- оптимизатором каким или просто градиентами.

источник

20:34пожаловаться #4

2017 May 29

YT

Yuriy Turchin in Глубинное обучение (группа)

Ребят, а подскажите. Увеличение размера batch-ей как сказывает на обучении?

источник

00:08пожаловаться #5

YT

Yuriy Turchin in Глубинное обучение (группа)

Улучшает аппроксимацию ф-ии ошибки?

источник

00:09пожаловаться #6

EZ

Evgeniy Zheltonozhskiy🇮🇱 in Глубинное обучение (группа)

Yuriy Turchin

Улучшает аппроксимацию ф-ии ошибки?

увеличивает, хотя есть всякие хитрые техники чтобы этого избежать

источник

00:12пожаловаться #7

YT

Yuriy Turchin in Глубинное обучение (группа)

Не понял, увеличивает — это значит менее точной делает? Ну т.е. все сгибы функции становятся более угловатыми?

источник

00:16пожаловаться #8

EZ

Evgeniy Zheltonozhskiy🇮🇱 in Глубинное обучение (группа)

Yuriy Turchin

Не понял, увеличивает — это значит менее точной делает? Ну т.е. все сгибы функции становятся более угловатыми?

результат хуже)

источник

00:16пожаловаться #9

EZ

Evgeniy Zheltonozhskiy🇮🇱 in Глубинное обучение (группа)

ну то есть там есть максимум, а дальше уменьшается

источник

00:16пожаловаться #10

YT

Yuriy Turchin in Глубинное обучение (группа)

Я понял, спасибо

источник

00:19пожаловаться #11

NK

ID:347198853 in Глубинное обучение (группа)

вообще-то это сложный вопрос, и вроде нет толком теоретического понимания какой размер батча оптимален

источник

02:19пожаловаться #12

AG

Azat Garifullin in Глубинное обучение (группа)

Здесь пару слов об этом сказали и дали ссылки:
http://www.inference.vc/everything-that-works-works-because-its-bayesian-2/

Everything that Works Works Because it's Bayesian: Why Deep Nets Generalize?

The Bayesian community should really start going to ICLR. They really should
have started going years ago. Some people actually have.

For too long we Bayesians have, quite arrogantly, dismissed deep neural networks
as unprincipled, dumb black boxes that lack elegance. We said that highly
over-parametrised models fitted via maximum likelihood can't possibly work, they
will overfit, won't generalise, etc. We touted our Bayesian nonparametric models
instead: Chinese restaurants, Indian buffets, Ga

источник

22:43пожаловаться #13

📒

📒 in Глубинное обучение (группа)

Кстати есть работы с применением топологии, дифгеома в дл?

источник

22:55пожаловаться #14

📒

📒 in Глубинное обучение (группа)

Я что то видел с числами бетти только но работа старая была

источник

22:56пожаловаться #15

2017 May 30

AG

Azat Garifullin in Глубинное обучение (группа)

Самый частый пример дифгеома про HMC с Римановскими многообразиями, наверное. Я мало знаю про дифгеом, но вот статья, про масштабируемый на дл HMC:
https://arxiv.org/abs/1506.04696

источник

00:42пожаловаться #16

AG

Azat Garifullin in Глубинное обучение (группа)

ну и information geomtry, судя по всему, становится достаточно хайповой

источник

00:43пожаловаться #17

KS

Konstantin Sozykin in Глубинное обучение (группа)

Мне тут один вопрос покоя не даёт. Для одной из задач которая у меня есть я хочу применить что-то вроде trainable loss function. Кто-то сталкивался с таким?

источник

05:21пожаловаться #18

KS

Konstantin Sozykin in Глубинное обучение (группа)

Условно. Допустим, мои лосс состоит из нескольких слогаемых

источник

05:22пожаловаться #19

KS

Konstantin Sozykin in Глубинное обучение (группа)

У которых есть коэффициенты

источник

05:22пожаловаться #20