Size: a a a

Мониторинг

2019 February 06

F

Fayantsev in Мониторинг
Ant0n Erem1n
Linux. Скрипт первичной оценки состояния системы на bash

С помощью данного скрипта пользователь получает информацию о системе: hostname, IP адрес, залогинившихся пользователей, uptime, load average, статистику по оперативной памяти, подкачке и дисках.

Для большего удобства можно добавить его в /etc/profile./ . Чтоб он выполнился скрипту нужно добавить расширение *.sh, тогда каждый раз при входе будет отображаться информация о системе.
фантастика. продавать за деньги.

p.s.: в мейнтейнеры как записаться? запушу шебанг немедля.
источник

F

Fayantsev in Мониторинг
если что, то это был сарказм. всем любви.
источник

AE

Ant0n Erem1n in Мониторинг
Fayantsev
фантастика. продавать за деньги.

p.s.: в мейнтейнеры как записаться? запушу шебанг немедля.
нечто подобное делали voxlink для своих дистров для freepbx. отчасти можно считать, что решение по "мониторингу первичному", было продано, вместе с решением для телефонии)
источник

V

Vladimir Pavlovsky in Мониторинг
Коллеги у кого есть Prtg, там лицензия как подписка идет?
источник

SR

Sin Ra in Мониторинг
Vladimir Pavlovsky
Коллеги у кого есть Prtg, там лицензия как подписка идет?
как на машины вроде и дороговато
источник

V

Vladimir Pavlovsky in Мониторинг
Sin Ra
как на машины вроде и дороговато
Ну 1600 на 500 сенсоров не очень дорого. Меня интересует разово ли нужно платить или у них есть подписка для обновлений
источник

SR

Sin Ra in Мониторинг
Vladimir Pavlovsky
Ну 1600 на 500 сенсоров не очень дорого. Меня интересует разово ли нужно платить или у них есть подписка для обновлений
обновлять надо
источник

SR

Sin Ra in Мониторинг
точно
источник

V

Vladimir Pavlovsky in Мониторинг
Sin Ra
обновлять надо
это для получения обновлений?
источник

SR

Sin Ra in Мониторинг
Vladimir Pavlovsky
это для получения обновлений?
не скажу. врать не буду.. начальник обновлял.
источник

V

Vladimir Pavlovsky in Мониторинг
Sin Ra
не скажу. врать не буду.. начальник обновлял.
Понял, спасибо
источник
2019 February 07

AE

Ant0n Erem1n in Мониторинг
Telegram-бот "Попингуй"

У многих админов, в том числе и у нас, используется система мониторинга Zabbix с прикрученным к ней телеграм-ботом, который всякие ворнинги постоянно кидает в группу. Но бывает так, что падает агент заббикса, или происходит ложное срабатывание, ну и так далее. В итоге приходится ночью вскакивать с кровати, бежать к компу, ломиться на рабочий комп по удаленке - и все это ради того, чтобы просто пропинговать ресурс и убедиться в том, что он жив. Вот и решил я написать свой бот на Python, который будет болтаться на сервере в локальной сети и по заявкам пользователей пинговать что надо.
Сначала добавляем себе супер-бота @BotFather, создаем через него своего бота и получаем токен, который надо будет указать в скрипте, затем переходим к разработке.

Сам скрипт выкладывать в канал смысла не вижу, его можно посмотреть по ссылкам ниже. Кроме стандартной работы с библиотекой telebot, интерес в скрипте представляет механизм авторизации. Используя библиотеку shelve, мы будем хранить в файле эдакую базу данных "ключ: значение". В качестве ключа у нас будет слово users, а в качестве значения - множество ID наших клиентов. При запуске скрипта мы читаем из базы идентификаторы в множество(если, конечно, там уже есть нужный ключ. Если его нет, то множество останется пустым):
db=shelve.open('/admin/teleusers.db')
allowed=set()
try:
 allowed=db["users"]
except:
 pass

Если пользователь отправит нам пароль, то мы внесем его в множество allowed и положим обновленное множество в базу:
if message.text == password:
   print message.from_user.id
   allowed.add(message.from_user.id)
   db["users"]=allowed
   bot.send_message(message.chat.id, 'Вы добавлены в список пользователей бота. Теперь можете писать адрес, который надо пропинговать')

При каждом запросе проверяем, "наш человек или посторонний". Если наш, то запускаем пинг и возвращаем результат. Если пинг завершится неуспешно, то выводим сообщение о недоступности ресурса.
if user in allowed:
    bot.send_message(message.chat.id, 'Пингую, подождите')
else:
    bot.send_message(message.chat.id, 'Пока не скажешь пароль, ничего не получишь!')


Для того, чтобы не заморачиваться с демонизацией скрипта, но при этом быть уверенным в его работе, воспользуемся systemctl - создадим файл  сервиса  /etc/systemd/system/telegrambot.service
[Unit]
Description=MyTelegramBot
After=multi-user.target

[Service]
Type=idle
ExecStart=/usr/bin/python /admin/telegrambot.py
Restart=always

[Install]
WantedBy=multi-user.target


Перечитаем список демонов и запустим нашего

sudo systemctl daemon-reload
sudo systemctl enable telegrambot.service
sudo systemctl start telegrambot.service


Все, можно пробовать подключаться.
Код можно посмотреть в wiki и в vk

http://pubwiki.mindsellers.ru/index.php/Telegram-%D0%91%D0%BE%D1%82_%22%D0%BF%D0%BE%D0%BF%D0%B8%D0%BD%D0%B3%D1%83%D0%B9%22

https://vk.com/@mindsellers-telegram-bot-popingui

источник
2019 February 08

AE

Ant0n Erem1n in Мониторинг
Вот тут человек, разбирает код мониторинга nmon, и на его основе фиксирует информацию о том, какие метрики в системе и каким образом можно снять.

https://github.com/NanXiao/read-nmon-code-to-learn-analyzing-linux-performance/blob/master/SUMMARY.md

источник
2019 February 09

АТ

Александр Терещенко in Мониторинг
Подскажите, пожалуйста, есть ли опыт мониторинга IBM MQ и чем?
источник
2019 February 11

AE

Ant0n Erem1n in Мониторинг
Александр Терещенко
Подскажите, пожалуйста, есть ли опыт мониторинга IBM MQ и чем?
Попробую вам помочь.

Ниже ресурсы на системы мониторинга, которые могут справится с вашей задачей. Насколько знаю у zabbix был шаблон для 2.2 версии.
Как вариант, могу вам посоветовать обратится к моему хорошему другу. У него есть компетенции с ibm mq. Контакт сообщу через личку.

1. https://blogs.biztalk360.com/monitoring-ibm-mq-with-biztalk360/

2. https://www.zabbix.com/integrations/ibm_mq

3. https://www.manageengine.com/products/applications_manager/websphere-mq-monitor.html

4. https://avadasoftware.com/product-details-infrared360/mq-monitoring/

5. https://sl.com/products/solution-packages/ibm-webspheremq/
источник

AE

Ant0n Erem1n in Мониторинг
Linux Performance Analysis in 60,000 Milliseconds

Через 60 секунд вы сможете получить общее представление об использовании системных ресурсов и запуске процессов, выполнив следующие десять команд:

uptime
dmesg | tail
vmstat 1
mpstat -P ALL 1
pidstat 1
iostat -xz 1
free -m
sar -n DEV 1
sar -n TCP,ETCP 1
top

Обатите внимание на методологию USE (Utilization Saturation and Errors) Method для анализа производительности любой системы.
Она поможет создать контрольный список, для анализа сервера и выявить узкие места или ошибки в ресурсах.
http://www.brendangregg.com/usemethod.html

Есть еще много команд и методологий, которые вы можете применить, например чебное пособие Brendan по производительности Linux для Velocity 2015
источник
2019 February 12

k

kbks in Мониторинг
Господа, а какие вещи стоит учитывать при создании кластера прома?
- количество метрик
- ретеншн
- что еще?
источник

k

kbks in Мониторинг
Тоже так думал
источник

IA

Ilya Ableev in Мониторинг
Не поминайте в суе
источник
2019 February 13

AE

Ant0n Erem1n in Мониторинг
Интересная серия статей в блоге KubeCost про мониторинг расхода денег на Kubernetes кластера и детектирование перерасхода средств. С красивыми дашбордами и готовыми запросами, протестированными для GKE и EKS

http://amp.gs/97o4
http://amp.gs/97oU
источник