Size: a a a

DevOps — русскоговорящее сообщество

2020 June 16

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество
Andrey Kartashov
а что говорит file /usr/local/dcgm-exporter/libdcgm.so.1 ?
data
источник

AK

Andrey Kartashov in DevOps — русскоговорящее сообщество
а должно быть чтото вроде ELF 64-bit LSB shared object
источник

AK

Andrey Kartashov in DevOps — русскоговорящее сообщество
может файл кривой
источник

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество
Andrey Kartashov
а должно быть чтото вроде ELF 64-bit LSB shared object
ога, грит не видит magic bytes
источник

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество
Sergey Trapeznikov
ога, грит не видит magic bytes
а, ну я понял крч, тут нвидиа обосрались и бинарем не раскатать релиз экспортера
источник

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество
надо именно офф пакетом ставить
источник

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество
вот их офф докерфайл
источник

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество
FROM ubuntu:18.04
LABEL io.k8s.display-name="NVIDIA DCGM Exporter"

COPY --from=builder /go/src/github.com/NVIDIA/gpu-monitoring-tools/dcgm-exporter /usr/bin/
COPY etc/dcgm-exporter /etc/dcgm-exporter

ARG DCGM_VERSION
RUN apt-get update && apt-get install -y --no-install-recommends \
   libgomp1 \
   wget && \
   rm -rf /var/lib/apt/lists/* && \
   wget --no-check-certificate https://developer.download.nvidia.com/compute/redist/dcgm/${DCGM_VERSION}/DEBS/datacenter-gpu-manager_${DCGM_VERSION}_amd64.deb && \
   dpkg -i datacenter-gpu-manager_*.deb && \
   rm -f datacenter-gpu-manager_*.deb

ENV NVIDIA_VISIBLE_DEVICES=all

RUN useradd dcgm-exporter
USER dcgm-exporter

ENTRYPOINT ["/usr/bin/dcgm-exporter"]
источник

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество
то есть он условно делает бинарник экспортера, пакетом доставляет остаток либ и запускает
источник

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество
а большинство экспортеров для прома имеют либы и тп уже внутри, и задачей по факту является только запуск бинарника
источник

AK

Andrey Kartashov in DevOps — русскоговорящее сообщество
Sergey Trapeznikov
FROM ubuntu:18.04
LABEL io.k8s.display-name="NVIDIA DCGM Exporter"

COPY --from=builder /go/src/github.com/NVIDIA/gpu-monitoring-tools/dcgm-exporter /usr/bin/
COPY etc/dcgm-exporter /etc/dcgm-exporter

ARG DCGM_VERSION
RUN apt-get update && apt-get install -y --no-install-recommends \
   libgomp1 \
   wget && \
   rm -rf /var/lib/apt/lists/* && \
   wget --no-check-certificate https://developer.download.nvidia.com/compute/redist/dcgm/${DCGM_VERSION}/DEBS/datacenter-gpu-manager_${DCGM_VERSION}_amd64.deb && \
   dpkg -i datacenter-gpu-manager_*.deb && \
   rm -f datacenter-gpu-manager_*.deb

ENV NVIDIA_VISIBLE_DEVICES=all

RUN useradd dcgm-exporter
USER dcgm-exporter

ENTRYPOINT ["/usr/bin/dcgm-exporter"]
так скопируй библиотечку оттуда
источник

AK

Andrey Kartashov in DevOps — русскоговорящее сообщество
УМВР
me@sshct:~$ /tmp/dcgmlibs/dcgm-exporter
INFO[0000] Starting dcgm-exporter
FATA[0000] libdcgm.so.1 not Found
me@sshct:~$ LD_LIBRARY_PATH=/tmp/dcgmlibs/ /tmp/dcgmlibs/dcgm-exporter
INFO[0000] Starting dcgm-exporter
Error: Failed to initialize NVML
FATA[0000] Error starting nv-hostengine: DCGM initialization error

@vizdrag
источник

AK

Andrey Kartashov in DevOps — русскоговорящее сообщество
у тебя просто файл криво скопирован откудато, вот LD_LIBRARY_PATH и не работает
источник

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество
Andrey Kartashov
УМВР
me@sshct:~$ /tmp/dcgmlibs/dcgm-exporter
INFO[0000] Starting dcgm-exporter
FATA[0000] libdcgm.so.1 not Found
me@sshct:~$ LD_LIBRARY_PATH=/tmp/dcgmlibs/ /tmp/dcgmlibs/dcgm-exporter
INFO[0000] Starting dcgm-exporter
Error: Failed to initialize NVML
FATA[0000] Error starting nv-hostengine: DCGM initialization error

@vizdrag
так я эти же сорсы взял и вытащил из репы либу, а потом задеплоил рядом с бинарником
источник

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество
или ты хочешь чтобы я из пакета либу взял
источник

AK

Andrey Kartashov in DevOps — русскоговорящее сообщество
Я скопировал из докеровского образа
источник

ST

Sergey Trapeznikov in DevOps — русскоговорящее сообщество
я щас через ar из пакета самого вытащу будет тоже самое, попробую
источник

AK

Andrey Kartashov in DevOps — русскоговорящее сообщество
/usr/lib/x86_64-linux-gnu/libdcgm.so.1
источник

m

manefesto in DevOps — русскоговорящее сообщество
Никто не в курсе как сделать в traefik роут по умолчанию ?
источник

MK

Mikhail Krivoshein in DevOps — русскоговорящее сообщество
manefesto
Никто не в курсе как сделать в traefik роут по умолчанию ?
Повесь на IP address или просто протокол
источник