Телеграмм чат группы ru_deep

>Но в остальных-то девяти тоже были какие то интерерсные идеи, почему о них никто не вспоминает?
потому что идеи может и интересные, но средняя ценность их на мой взгляд низкая.
большинство идей — просто оптимизация архитектуры под задачу, результат метода проб и ошибок, а не инсайты.

источник

17:03пожаловаться #6

EM

Evgenii Makarov in Глубинное обучение (группа)

Вопрос был в СОТА. Получается, ресерч превратился в соревновательный дата саенс. Вот представь, пишет Эйнштейн Е=мс^2. И тут ему: а давай протестим на миллионах соединений, точно ли это, а то вот тут предлагают костыль к твоей формуле, так он точность на 0,01% лучше дает на углероде

источник

17:03пожаловаться #7

EM

Evgenii Makarov in Глубинное обучение (группа)

А ведь какая нить "He" инициализация весов - это тот самый костыль и есть

источник

17:04пожаловаться #8

YB

Yuri Baburov in Глубинное обучение (группа)

вот на мой взгляд как раз не превратился ресёрч в соревновательный дата-саенс.
да, SOTA — критерий ценности, но это не значит, что уменьшение точности на 1% снижает ценность реализации до нуля.

источник

17:04пожаловаться #9

EZ

Evgeniy Zheltonozhskiy🇮🇱 in Глубинное обучение (группа)

Evgenii Makarov

Вопрос был в СОТА. Получается, ресерч превратился в соревновательный дата саенс. Вот представь, пишет Эйнштейн Е=мс^2. И тут ему: а давай протестим на миллионах соединений, точно ли это, а то вот тут предлагают костыль к твоей формуле, так он точность на 0,01% лучше дает на углероде

это мы еще вопрос reproducibility не подняли

источник

17:06пожаловаться #10

YB

Yuri Baburov in Глубинное обучение (группа)

наоборот, скорее, все понимают, что E=mc^2+q(m) при малом q — не сильно отличается от E=mc^2 и примерно ему эквивалентен, и мы не можем даже, если вспомним физику и рассчёт ошибок измерения, отличить одну формулу от другой на практике.

источник

17:06пожаловаться #11

YB

Yuri Baburov in Глубинное обучение (группа)

Evgeniy Zheltonozhskiy🇮🇱

это мы еще вопрос reproducibility не подняли

вопрос reproducibility опять же становится важным только если считать выигрыш 0.01% точности как "100% ценности данной реализации и 0% остальных"

источник

17:08пожаловаться #12

YB

Yuri Baburov in Глубинное обучение (группа)

Yuri Baburov

вопрос reproducibility опять же становится важным только если считать выигрыш 0.01% точности как "100% ценности данной реализации и 0% остальных"

а иначе (если важно не относительное лидерство в SOTA, а абсолютная точность, то) , скорее, похожие работы с похожей точностью помогают подтвердить точность друг друга.

источник

17:10пожаловаться #13

YB

Yuri Baburov in Глубинное обучение (группа)

"помогают подтвердить точность друг друга" — опять же как различные измерения одной и той же величины в физике помогают точнее оценить правильность формулы и оценить распределение ошибки этих измерений.

источник

17:12пожаловаться #14

YB

Yuri Baburov in Глубинное обучение (группа)

так что и я как раз против того, чтобы считать преимущества модели капсюлей в CIFAR существенными (на основании SOTA). более того, объясняю, что ошибка измерений точности в данной модели достаточно высокая.

источник

17:15пожаловаться #15

EM

Evgenii Makarov in Глубинное обучение (группа)

Ну почему же. Здесь мы вступаем в область споров о том, что является стопудовой валидацией. Они на мнисте тренились, а на аффнисте тестили, увидели прирост. Доказательство? Навряд ли. Evidence? Пожалуй да

источник

17:18пожаловаться #16

EZ

Evgeniy Zheltonozhskiy🇮🇱 in Глубинное обучение (группа)

Yuri Baburov

вопрос reproducibility опять же становится важным только если считать выигрыш 0.01% точности как "100% ценности данной реализации и 0% остальных"

ну то есть если чуваки пропихивают в топ конференции методы которые не работают, это норм?

источник

17:24пожаловаться #17

YB

Yuri Baburov in Глубинное обучение (группа)

Evgenii Makarov

Ну почему же. Здесь мы вступаем в область споров о том, что является стопудовой валидацией. Они на мнисте тренились, а на аффнисте тестили, увидели прирост. Доказательство? Навряд ли. Evidence? Пожалуй да

А, видимо, это сообщение я неправильно прочитал. Я не помню этот момент в работе: они сравнивали это с другими моделями, которые тренировались на аффнете?

источник

17:24пожаловаться #18

YB

Yuri Baburov in Глубинное обучение (группа)

Evgeniy Zheltonozhskiy🇮🇱

ну то есть если чуваки пропихивают в топ конференции методы которые не работают, это норм?

Не норм, ибо вносит "шум измерений ценности идей"

источник

17:26пожаловаться #19

EZ

Evgeniy Zheltonozhskiy🇮🇱 in Глубинное обучение (группа)

или если например метод работает только на очень маленьком интервале гиперпараметров, который в статье не указан, но при этом дает SoTA на этом единственном наборе параметров и единственном датасете

источник

17:27пожаловаться #20