Size: a a a

Глубинное обучение (группа)

2017 September 07

KS

Konstantin Sozykin in Глубинное обучение (группа)
Yuriy Turchin
Всем привет. Такой вопрос. Сильно ли можно повысить скорость обучения, если прикрутить вторую видеокарту через crossfire? (Пусть будет две 1060ых карточки) Придется ли все вручную параллелить или есть способы, которые это делают автоматически?
Нету. все руками. Кто-то даже статьи на эту тему пишет на arxiv
источник

YT

Yuriy Turchin in Глубинное обучение (группа)
А эффект стоит того?  Сильно ли вообще повышается в среднем скорость?
источник

KS

Konstantin Sozykin in Глубинное обучение (группа)
ну если ты прям large-scale эксперименты делаешь. Ну например VGG Image Net на 6-8 картах тренируют
источник

KS

Konstantin Sozykin in Глубинное обучение (группа)
Artem Kondyukov
Руками все, но это сейчас стало совсем несложно. Смысл (почти) всегда есть. Только 1060 — это SLI, а не CF :)
а что можно сделать кроме раскидывания батчей по видюхам и усреднения градиентов в общем случае?
источник

KS

Konstantin Sozykin in Глубинное обучение (группа)
Yuriy Turchin
А эффект стоит того?  Сильно ли вообще повышается в среднем скорость?
Ну то есть не будет такого, что воткнул две видео карты и стало в 1.5-2 раза быстрее работать само по себе
источник

AK

Artem Kondyukov in Глубинное обучение (группа)
Konstantin Sozykin
а что можно сделать кроме раскидывания батчей по видюхам и усреднения градиентов в общем случае?
Ничего
источник

YT

Yuriy Turchin in Глубинное обучение (группа)
Надо посмотреть как параллелить такие вещи. Последний раз с таким работал в OpenMP/MPI. Спасибо за помощь.
источник

KS

Konstantin Sozykin in Глубинное обучение (группа)
Ответили уже
источник

YT

Yuriy Turchin in Глубинное обучение (группа)
Да, я в теории понял, спасибо. Осталось практически понять)
источник

YT

Yuriy Turchin in Глубинное обучение (группа)
именно как в тензор флоу например это делать
источник

KS

Konstantin Sozykin in Глубинное обучение (группа)
Удачи ;)
источник

EZ

Evgeniy Zheltonozhskiy🇮🇱 in Глубинное обучение (группа)
Squeeze-and-Excitation Networks -  ILSVRC 2017 winner https://arxiv.org/abs/1709.01507
источник

EZ

Evgeniy Zheltonozhskiy🇮🇱 in Глубинное обучение (группа)
Yuriy Turchin
именно как в тензор флоу например это делать
есть пример же в доках
источник

A

Andrey in Глубинное обучение (группа)
А нужен ли SLI?
источник

IU

Ivan U in Глубинное обучение (группа)
Andrey
А нужен ли SLI?
Ты намекаешь не купить ли вместо двух одну но мощную?
источник

YB

Yuri Baburov in Глубинное обучение (группа)
Yuriy Turchin
Всем привет. Такой вопрос. Сильно ли можно повысить скорость обучения, если прикрутить вторую видеокарту через crossfire? (Пусть будет две 1060ых карточки) Придется ли все вручную параллелить или есть способы, которые это делают автоматически?
Может и можно, но сильно зависит от задачи. Из пакетов, которые круто параллелят -- MXnet, CNTK.
источник

YB

Yuri Baburov in Глубинное обучение (группа)
А с tensorflow вполне может быть и так, что от смены пакета на другой скорость уже в 1.5 раза повысится) опять же, зависит от задачи
источник

FZ

Fyodor Zhdanov in Глубинное обучение (группа)
SLI сильного прироста не даст. Он для обмена данных между картами, в DL обмен данными не узкое место. Т.е. что со SLI, что без скорость примерно та же будет.
Кроме батчей глубокие рекуррентные сетки тоже хорошо параллелятся.
источник

FZ

Fyodor Zhdanov in Глубинное обучение (группа)
И, кстати, 1060 sli не имеет.
источник

YB

Yuri Baburov in Глубинное обучение (группа)
Fyodor Zhdanov
SLI сильного прироста не даст. Он для обмена данных между картами, в DL обмен данными не узкое место. Т.е. что со SLI, что без скорость примерно та же будет.
Кроме батчей глубокие рекуррентные сетки тоже хорошо параллелятся.
Точнее, это редко узкое место. Для больших изображений вполне может быть узким местом.
источник