Телеграмм чат группы devops_ru страница 31295

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

DevOps — русскоговорящее сообщество

8374 membersпожаловаться на группу

2020 June 26

*

*sm1Ly in DevOps — русскоговорящее сообщество

Sergey Trapeznikov

кто нибудь пробовал снимать потребление GPU ресурсов приложениями для nvidia? я чет посмотрел по офф докам, можно только снимать статистику видеокарты через nvidia-интерфейс, и как с /proc потребление ресурсов не снять. есть какие то способы?

я сейчас бяку предложу, но может под моно/вином запустить что-то вроде msi afterburner ?

источник

14:22пожаловаться #1

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество

netdata ?

netdata собирает данные с nvidia system management interface (NVML), это именно та ограниченная инфа о которой я говорю, толку от этих данных немного

источник

14:22пожаловаться #2

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество

это тупо утилизация карты

источник

14:22пожаловаться #3

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество

а не потребления приложением

источник

14:22пожаловаться #4

*

*sm1Ly in DevOps — русскоговорящее сообщество

Sergey Trapeznikov

а не потребления приложением

аааа, так пни кодеров, пусть прикрутят

источник

14:23пожаловаться #5

GG

George Gaál in DevOps — русскоговорящее сообщество

аааа, так пни кодеров, пусть прикрутят

точно

источник

14:23пожаловаться #6

GG

George Gaál in DevOps — русскоговорящее сообщество

Sergey Trapeznikov

а не потребления приложением

nvidia-smi показывает разбивку ?

источник

14:23пожаловаться #7

*

*sm1Ly in DevOps — русскоговорящее сообщество

точно

ну счётчики явно бизнесу нужны)

источник

14:24пожаловаться #8

O

OleBel in DevOps — русскоговорящее сообщество

Имею практический опыт укладывания стека в кластере k8s/apps/efk посчитанного и минимизированного впритык без учёта логов. После переполнения томов в эластике и очистки старых индексов поток логов с fluentd грузил эластик так что ноды где ранились поды эластика становились NotReady. LA ~70 перед пересозданием нод и цепная реакция по всему стеку. Решили уводом эастика на выделенную группу нод.

источник

14:24пожаловаться #9

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество

nvidia-smi и парсить

есть костыльный способ, но он работает только для контейнеров на композе, например привязывать один контейнер на одну карту, так можно мониторить сколько именно этот контейнер сьел памяти в целом от карты и ее утилизацию. По факту в данном случае нагрузка на карту = нагрузка выделяемая приложением

с кубером когда у тебя несколько подов на нескольких картах, например 18\6, ты не можешь точно знать сколько какое приложение сьело данных

источник

14:24пожаловаться #10

GG

George Gaál in DevOps — русскоговорящее сообщество

Sergey Trapeznikov

есть костыльный способ, но он работает только для контейнеров на композе, например привязывать один контейнер на одну карту, так можно мониторить сколько именно этот контейнер сьел памяти в целом от карты и ее утилизацию. По факту в данном случае нагрузка на карту = нагрузка выделяемая приложением

с кубером когда у тебя несколько подов на нескольких картах, например 18\6, ты не можешь точно знать сколько какое приложение сьело данных

чувак, я знаю

источник

14:25пожаловаться #11

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество

аааа, так пни кодеров, пусть прикрутят

и откуда им собирать данные? сам nvidia драйвер и интерфейс это не дает

источник

14:25пожаловаться #12

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество

я даже охуел
20 лет сука продают железо и не умеют в мониторинг по приложениям я ебал

источник

14:25пожаловаться #13

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество

20!

источник

14:25пожаловаться #14

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество

или 40 я уже не знаю

источник

14:25пожаловаться #15

GG

George Gaál in DevOps — русскоговорящее сообщество

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0      8669      C   /opt/conda/bin/python                      30881MiB |
|    1      8670      C   /opt/conda/bin/python                      29283MiB |
|    2      8671      C   /opt/conda/bin/python                      30261MiB |
|    3      8672      C   /opt/conda/bin/python                      31729MiB |
+-----------------------------------------------------------------------------+

источник

14:25пожаловаться #16

GG

George Gaál in DevOps — русскоговорящее сообщество

Sergey Trapeznikov

я даже охуел
20 лет сука продают железо и не умеют в мониторинг по приложениям я ебал

потому что это нахер не надо

источник

14:25пожаловаться #17

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество

потому что это нахер не надо

а разработка как тогда идет

источник

14:26пожаловаться #18

GG

George Gaál in DevOps — русскоговорящее сообщество

Sergey Trapeznikov

а разработка как тогда идет

у тебя лимитов нет все равно

источник

14:26пожаловаться #19

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0      8669      C   /opt/conda/bin/python                      30881MiB |
|    1      8670      C   /opt/conda/bin/python                      29283MiB |
|    2      8671      C   /opt/conda/bin/python                      30261MiB |
|    3      8672      C   /opt/conda/bin/python                      31729MiB |
+-----------------------------------------------------------------------------+

это smi?

источник

14:26пожаловаться #20