Телеграмм чат группы devops_ru страница 31296

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

DevOps — русскоговорящее сообщество

8374 membersпожаловаться на группу

2020 June 26

GG

George Gaál in DevOps — русскоговорящее сообщество

Sergey Trapeznikov

это smi?

так точно

источник

14:26пожаловаться #1

GG

George Gaál in DevOps — русскоговорящее сообщество

у тебя нет лимитов

источник

14:26пожаловаться #2

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество

лимитов где

источник

14:26пожаловаться #3

GG

George Gaál in DevOps — русскоговорящее сообщество

и если у тебя приложение запущено на гпу и второе не влезает, то ты получаешь просто no memory

источник

14:26пожаловаться #4

*

*sm1Ly in DevOps — русскоговорящее сообщество

Sergey Trapeznikov

и откуда им собирать данные? сам nvidia драйвер и интерфейс это не дает

блин, я тебя ненавижу.

источник

14:26пожаловаться #5

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество

и если у тебя приложение запущено на гпу и второе не влезает, то ты получаешь просто no memory

+++

источник

14:26пожаловаться #6

GG

George Gaál in DevOps — русскоговорящее сообщество

и ограничить нельзя первое, скажем, по границе 1ГБ

источник

14:26пожаловаться #7

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество

блин, я тебя ненавижу.

источник

14:26пожаловаться #8

*

*sm1Ly in DevOps — русскоговорящее сообщество

я теперь думаю как это сделать

источник

14:26пожаловаться #9

*

*sm1Ly in DevOps — русскоговорящее сообщество

мне будто своего секса мало

источник

14:27пожаловаться #10

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество

мне надо знать потреблялку за под
а DCGM собирает инфу только с карты

источник

14:27пожаловаться #11

GG

George Gaál in DevOps — русскоговорящее сообщество

Sergey Trapeznikov

мне надо знать потреблялку за под
а DCGM собирает инфу только с карты

страдай

источник

14:28пожаловаться #12

GG

George Gaál in DevOps — русскоговорящее сообщество

нет готового решения

источник

14:28пожаловаться #13

GG

George Gaál in DevOps — русскоговорящее сообщество

точка

источник

14:28пожаловаться #14

GG

George Gaál in DevOps — русскоговорящее сообщество

идеально - по видяхе на тенанта

источник

14:28пожаловаться #15

GG

George Gaál in DevOps — русскоговорящее сообщество

в текущей ситуации

источник

14:28пожаловаться #16

GG

George Gaál in DevOps — русскоговорящее сообщество

Sergey Trapeznikov

есть костыльный способ, но он работает только для контейнеров на композе, например привязывать один контейнер на одну карту, так можно мониторить сколько именно этот контейнер сьел памяти в целом от карты и ее утилизацию. По факту в данном случае нагрузка на карту = нагрузка выделяемая приложением

с кубером когда у тебя несколько подов на нескольких картах, например 18\6, ты не можешь точно знать сколько какое приложение сьело данных

вот как тут ты и сказал - привязывать одно устройство через —gpus или CUDA_VISIBLE_DEVICES

источник

14:28пожаловаться #17

АА

Алексей Артамонов... in DevOps — русскоговорящее сообщество

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0      8669      C   /opt/conda/bin/python                      30881MiB |
|    1      8670      C   /opt/conda/bin/python                      29283MiB |
|    2      8671      C   /opt/conda/bin/python                      30261MiB |
|    3      8672      C   /opt/conda/bin/python                      31729MiB |
+-----------------------------------------------------------------------------+

++++++

источник

14:31пожаловаться #18

АА

Алексей Артамонов... in DevOps — русскоговорящее сообщество

вот как тут ты и сказал - привязывать одно устройство через —gpus или CUDA_VISIBLE_DEVICES

так и делаем)

источник

14:32пожаловаться #19

АА

Алексей Артамонов... in DevOps — русскоговорящее сообщество

@vizdrag больше мониторинга, вам надо больше мониторинга. Потом когда сделаешь идеальный мониторинг, не забудь его тоже надо мониторить.

источник

14:33пожаловаться #20