Size: a a a

Kubernetes — русскоговорящее сообщество

2020 June 29

SM

Sergey Monakhov in Kubernetes — русскоговорящее сообщество
nvidia-runtime в помощь
источник

EL

Empty Lungs in Kubernetes — русскоговорящее сообщество
George Gaál
тебе надо, чтобы у тебя рантайм был подключен при создании конкретного контейнера
/etc/docker/daemon.json
{
   "default-runtime": "nvidia",
   "runtimes": {
       "nvidia": {
           "path": "/usr/bin/nvidia-container-runtime",
           "runtimeArgs": []
       }
   }
}

после этого докер рестартил
источник

GG

George Gaál in Kubernetes — русскоговорящее сообщество
Empty Lungs
/etc/docker/daemon.json
{
   "default-runtime": "nvidia",
   "runtimes": {
       "nvidia": {
           "path": "/usr/bin/nvidia-container-runtime",
           "runtimeArgs": []
       }
   }
}

после этого докер рестартил
я допускаю, что этого будет недостаточно - ты проверял docker inspect'ом, что контейнеры создаются как надо, а куб не игнорирует настройки докера ?
источник

GG

George Gaál in Kubernetes — русскоговорящее сообщество
еще необходимое условие работы - наличие внутри контейнра библиотек (названия точные файлов не помню)
источник

GG

George Gaál in Kubernetes — русскоговорящее сообщество
https://github.com/NVIDIA/k8s-device-plugin - эта же фигня, как я понял, тебе нужна, если ты хочешь аннотацией limits:
         nvidia.com/gpu: пользоваться
источник

ST

Sergey Trapeznikov in Kubernetes — русскоговорящее сообщество
Empty Lungs
Мне в подах нужен вывод nvidia-smi, что-то типа кастомного экспортера.
В подах демонсета девайс плагина гпу ес-но не запрашиваются, но при этом софт nvidia есть и при этом руками он не ставится, либо я в упор этого не вижу.
не совсем понял а с какой целью вообще это иметь внутри пода
источник

ST

Sergey Trapeznikov in Kubernetes — русскоговорящее сообщество
George Gaál
https://github.com/NVIDIA/k8s-device-plugin - эта же фигня, как я понял, тебе нужна, если ты хочешь аннотацией limits:
         nvidia.com/gpu: пользоваться
+
источник

EL

Empty Lungs in Kubernetes — русскоговорящее сообщество
Sergey Trapeznikov
не совсем понял а с какой целью вообще это иметь внутри пода
небольшой велосипед - под собирает инфу о железе на ноде и шлёт в отдельный сервис.
источник

SM

Sergey Monakhov in Kubernetes — русскоговорящее сообщество
Empty Lungs
Всем привет. Может кто-нибудь пояснить каким образом девайс плагин прокидывает драйвера в поды? И можно ли прокинуть дрова в под, не запрашивая при этом гпу? В конкретном случае nvidia-device-plugin
если что, он вам не драйвер прокидывает, а устройство, но эт мелочи, в чем проблема то
источник

ST

Sergey Trapeznikov in Kubernetes — русскоговорящее сообщество
Empty Lungs
небольшой велосипед - под собирает инфу о железе на ноде и шлёт в отдельный сервис.
для этого есть просто dcgm-exporter, kubelet и node-exporter
источник

SM

Sergey Monakhov in Kubernetes — русскоговорящее сообщество
Sergey Trapeznikov
для этого есть просто dcgm-exporter, kubelet и node-exporter
ну не совсем, гпу модель тут ничего не провайдит
источник

ST

Sergey Trapeznikov in Kubernetes — русскоговорящее сообщество
Sergey Monakhov
ну не совсем, гпу модель тут ничего не провайдит
это да, но я завел ишшу))
источник

ST

Sergey Trapeznikov in Kubernetes — русскоговорящее сообщество
в любом случае можно самому дописать я думаю
источник

SM

Sergey Monakhov in Kubernetes — русскоговорящее сообщество
Sergey Trapeznikov
в любом случае можно самому дописать я думаю
мона
источник

EL

Empty Lungs in Kubernetes — русскоговорящее сообщество
Sergey Monakhov
если что, он вам не драйвер прокидывает, а устройство, но эт мелочи, в чем проблема то
про устройство то понятно, помимо этого и нужный софт закидывается в под.

поднимаю под на nvidia ноде без запрос гпу - nvidia-smi нет
с запросом нужный софт есть
источник

EL

Empty Lungs in Kubernetes — русскоговорящее сообщество
Sergey Monakhov
ну не совсем, гпу модель тут ничего не провайдит
помимо модели нужна инфа куда воткнута карта, цпу, рама и тд
источник

SM

Sergey Monakhov in Kubernetes — русскоговорящее сообщество
> нужный софт закидывается в под.
если это не образ с кудой, то нет, не прокидывается
источник

EL

Empty Lungs in Kubernetes — русскоговорящее сообщество
я поднимаю обычный sshd
нужный мне софт - nvidia-smi и он там есть)
источник

GG

George Gaál in Kubernetes — русскоговорящее сообщество
Empty Lungs
я поднимаю обычный sshd
нужный мне софт - nvidia-smi и он там есть)
библиотеки нужны )
источник

EL

Empty Lungs in Kubernetes — русскоговорящее сообщество
контейнеры при этом запускаются в nvidia рантайме
источник