Size: a a a

Глубинное обучение (группа)

2017 April 14

A

Andrey in Глубинное обучение (группа)
Понял, спасибо. Из оригинальной статьи совсем непонятно было
источник

YB

Yuri Baburov in Глубинное обучение (группа)
сложность всегда в том, как эффективно на железо алгоритм развернуть. можно получить до 10 раз разгон или падение производительности.
источник

YB

Yuri Baburov in Глубинное обучение (группа)
и просто элементарными умножениями там поэтому нельзя считать
источник

YB

Yuri Baburov in Глубинное обучение (группа)
нужно весь пайплайн оценивать и оптимизировать
источник

A

Andrey in Глубинное обучение (группа)
Выходит, авторы статьи про инсепшн слегка приукрасили, что при уменьшении количества весов в (9+9)/25 раз при переходе от 5х5 сверток к двум 3х3 сверткам вычислений делается ровно в (9+9)/25 меньше? Ведь сама по себе векторизация будет работать с любыми свертками.
источник

YB

Yuri Baburov in Глубинное обучение (группа)
Тут недавно была красивая картинка со сравнением вычислительной сложности сетей
источник

A

Andrey in Глубинное обучение (группа)
Я видел
источник

YB

Yuri Baburov in Глубинное обучение (группа)
источник

A

Andrey in Глубинное обучение (группа)
Если это та, которая с кружочками
источник

YB

Yuri Baburov in Глубинное обучение (группа)
ага. я не знаю, как они её строили — по реальному времени на железе или по рассчётам времени вычисления
источник

YB

Yuri Baburov in Глубинное обучение (группа)
но для 3x3 есть более быстрые кернелы чем для 5х5, в этом смысл.
источник

YB

Yuri Baburov in Глубинное обучение (группа)
иногда даже 3х3 на 3х1+1x3 разбивают, качество близко а скорость ещё выше.
источник

A

Andrey in Глубинное обучение (группа)
Это я понимаю, как и профиты от использования сверток 1х1. Дам ссылку на этот чатик автору вопроса
источник

YB

Yuri Baburov in Глубинное обучение (группа)
я там кратенько описал и ссылку приложил на статьи на сайте нерваны
источник

NK

ID:347198853 in Глубинное обучение (группа)
привет ребята
источник

NK

ID:347198853 in Глубинное обучение (группа)
спасибо за ответы на вк
источник

NK

ID:347198853 in Глубинное обучение (группа)
но я все-таки не совсем убежден что в статье про inception имели ввиду факторизацию матриц
источник

NK

ID:347198853 in Глубинное обучение (группа)
там упоминается reuse of activations, и даются конкретные числа 18/25
источник

NK

ID:347198853 in Глубинное обучение (группа)
вы можете показать почему количество активаций соответсвует количеству весов, на конкретном примере перехода с 5х5 к двум уровням 3х3?
источник

EZ

Evgeniy Zheltonozhskiy🇮🇱 in Глубинное обучение (группа)
ID:347198853
вы можете показать почему количество активаций соответсвует количеству весов, на конкретном примере перехода с 5х5 к двум уровням 3х3?
Веса общие может?
источник