Size: a a a

Мониторинг

2020 January 16

AE

Ant0n Erem1n in Мониторинг
Istio as an Example of When Not to Do Microservices

Istio как пример сервиса, которому больше подходит монолитная архитектура вместо микросервисной.

https://blog.christianposta.com/microservices/istio-as-an-example-of-when-not-to-do-microservices
источник

AE

Ant0n Erem1n in Мониторинг
Какие метрики и какими инструментами нужно замониторить в Istio.

Key metrics for monitoring Istio
https://www.datadoghq.com/blog/istio-metrics

Istio monitoring tools
https://www.datadoghq.com/blog/istio-monitoring-tools
источник
2020 January 17

AE

Ant0n Erem1n in Мониторинг
Дмитрий Комаров из Яндекс-денег рассказывает как они у себя делали MaaC — мониторинг как код. К приложению в виде зависимости добавляется дополнительный артефакт, который генерит новые дашборды в Grafana и порождает соответствующий сбор метрик через StatsD и Heka. Говорит, что Heka это хорошо из-за бестродействия в силу приёма метрик от приложений по протоколу UDP.

Ещё одна важная часть его выступления — это алертинг. Алертинг в Grafana оказался недостаточно гибким и они использовали Moira, которая позволила гибко создавать триггеры и использует собственное хранилище на базе Redis.

Ниже ссылки на соответствующие репозитории на Github:

moira-trigger-plugin
moira-kotlin-dsl
grafana-dashboard-dsl
moira-kotlin-client
grafana-dashboard-plugin
источник

AE

Ant0n Erem1n in Мониторинг
Статья на Хабре про партиционирование MySQL под нужды Zabbix. Проблема партиционирования, конечно, решается использованием TimescaleDB, но, если по каким-то причинам её использование невозможно, статья будет полезна.
источник

AE

Ant0n Erem1n in Мониторинг
Хоум Кредит унд Финанс банк пишет как они прикрутили к своему мониторингу на Zabbix и ELK машинное обучение. Вот теперь дежурные могут расслабиться 🙂
источник
2020 January 20

TB

Timur Baitenov in Мониторинг
источник
2020 January 24

AE

Ant0n Erem1n in Мониторинг
И тем временем Grafana v6.6 вот-вот выйдет, и уже можно посмотреть что там будет новенького 😅

http://amp.gs/DbBl
#grafana #news
источник

AE

Ant0n Erem1n in Мониторинг
Grafana Labs рассказали о недавнем инциденте с downttime на 23 часа и какие уроки они из этого вынесли

http://amp.gs/Dbjv

И заодно история от Dropbox http://amp.gs/DbjE и доклад с SREcon http://amp.gs/DbjV
#grafana #dropbox #article #incidentreport
источник

AE

Ant0n Erem1n in Мониторинг
источник

AE

Ant0n Erem1n in Мониторинг
​​И снова про Alertmanager от Prometheus

Смотреть актуальные алерты в почте/слаке/телеграме не самая приятная затея. Поэтому мы  используем плагин для Grafana: http://bit.ly/2ttHY25

Но потом появился вопрос как посчитать кол-во однотипных проблем, самые популярные алерты, ну и все в этом роде. Это позволит провести некоторый тюнинг, понизить критичность и так далее. Хотя понизить уровень severity в не нужных местах удалось так: поставили ардуину со здоровенной мигалкой, она бегает в апишку alertmanager и если есть critical на проде - крутит 🚨 Осталось прикрутить Алису, чтобы она кричала что-нибудь по немецки.

В общем у алертменеджера есть ручка с метриками /metrics, но в ней нет метрик по конкретным алертам и чего либо более менее интересного. На гитхабе они сами предлагают через webhook слать события к примеру в Elasticsearch. Парни из cloudflare так и сделали: http://bit.ly/2tDLdUs

Пока не пробовал, результатами не поделюсь ☹️

На десерт предлагаю почитать статью от Uber про on-call dashboard: https://ubr.to/2TN63f4
источник

AE

Ant0n Erem1n in Мониторинг
В VictoriaMetrics добавил поддержку мигрирования данных из influx в VM

https://github.com/VictoriaMetrics/vmctl
источник

AE

Ant0n Erem1n in Мониторинг
Весточка для линукс-администраторов. Но и безопасников тоже заинтересует. Ещё один подход к сбору системных логов с линукс-серверов — rsyslog + logstash + elasticsearch + kibana. Некто Антуан Солничкин просто и пошагово пишет какие команды и зачем выполнять, чтобы конструкция взлетела. Мануал подойдёт, если нужно быстро запустить мониторинг.

P.S. Посмотрите другие статьи этого автора на Медиуме, пишет он преимущественно про мониторинг причём разными средствами и подробно.
источник

AE

Ant0n Erem1n in Мониторинг
ЦИАН рассказывает как у них устроен сбор и анализ логов. На Elastic Stack.
источник

AE

Ant0n Erem1n in Мониторинг
Хоум Кредит унд Финанс банк пишет как они прикрутили к своему мониторингу на Zabbix и ELK машинное обучение. Вот теперь дежурные могут расслабиться 🙂
источник

IA

Ilya Ableev in Мониторинг
Ant0n Erem1n
Хоум Кредит унд Финанс банк пишет как они прикрутили к своему мониторингу на Zabbix и ELK машинное обучение. Вот теперь дежурные могут расслабиться 🙂
Вроде было.
Сыро и статья ниачём
источник

AE

Ant0n Erem1n in Мониторинг
Мониторинг Mikrotik в Zabbix

https://bookflow.ru/monitoring-mikrotik-v-zabbix/
источник
2020 February 02

M

Mister X in Мониторинг
/stat@combot
источник

C

Combot in Мониторинг
источник
2020 February 04

>

>:) in Мониторинг
Ребят , а стоит мониторить KERIO заббиксом ? Есть полезная инфа ?
источник

KZ

Kamil Zaripov in Мониторинг
>:)
Ребят , а стоит мониторить KERIO заббиксом ? Есть полезная инфа ?
новый керио умеет в snmp, можешь мониторить
источник